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^ (57) Abstract: The invention concerns the genome sequence and nucleotide sequences coding for Streptococcus agalactiae polypep- 

Q£ tides, such as cellular envelope polypeptides, or secreted or specific polypeptides, or polypeptides involved in the metabolism and the 

fS replication process, as well as vectors or cells comprising said sequences. The invention also concerns the use thereof for developing 

OS vaccines, diagnostic tools, DNA chips and for identifying therapeutic targets. 

(57) Abrege : L'invention a pour objet )a sequence genomique et des sequences nucleotidiques codant pour des polypeptides de 
Streptococcus agalactiae, tels que des polypeptides d f enveloppe cellulaire, ou des polypeptides secretes ou specifiques, ou impliques 
Q dans le mclabolisme et dans le processus de replication, ainsi que des vecteurs ou cellules incluant lesdites sequences. U invention 
£>■ portc egalcment sur leur application au developpement de vaccins, d'outils de diagnostic, de puces a ADN et a V identification de 
^ ciblcs thcrapeutiques. 
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Sequence du genome Streptococcus agalactiae^ application au developpement de 
vaccins, d'outils de diagnostic, et a Identification de cibles therapeutiques. 

L'invention a pour objet la sequence genomique et des sequences nucleotidiques 
5 codant pour des polypeptides de Streptococcus agalactiae, tels que des polypeptides 
d'enveloppe cellulaire, ou des polypeptides secretes ou specifiques, ou impliques dans 
le metabolisme et dans le processus de replication, ainsi que des vecteurs ou cellules 
incluant lesdites sequences. L'invention porte egalement sur leur application au 
developpement de vaccins, d'outils de diagnostic, de puces a ADN et a 1'identification 
10 de cibles therapeutiques. 

Streptococcus agalactiae est un streptocoque P-hemoIytique qui constitue la 
seule espece appartenant au groupe B de Lancefield (SGB). Les infections neonatales a 
streptocoques du groupe B posent un important probleme de sante publique qui ne se 

1 5 limite pas aux pays en voie de developpement. Leur incidence est de 2,5 pour 1 000 
naissances, avec un taux de mortalite qui varie actuellement dans les pays industrialises 
entre 4 et 10 % selon les etudes. Cette bacterie est responsable d'environ 20 % des 
meningites bacteriennes recensees en France et des sequelles neurologiques sont alors 
observees dans 25 a 50 % des cas. Elle est egalement a 1'origine de mort foetale in utero. 

20 Le polyoside capsulaire est Tantigene de surface majeur des SGB. Cinq serotypes (la, 
lb, II, III et V) sont generalement detectes au cours des infections humaines, le serotype 
III etant retrouve dans 75 % des infections neonatales avec atteinte meningee. Au 
niveau cellulaire et moleculaire, les differentes etapes du processus infectieux du a & 
agalactiae sont encore peu connues. II est vraisemblable que, dans le cas du syndrome 

25 precoce (infections survenant dans les 24 premieres heures), la bacterie inhalee penetre 
dans les cellules de Tepithelium alv^olaire du nouveau-ne et traverse cette barriere pour 
disseminer ulterieurement dans la circulation generale. La genese du syndrome tardif 
precoce (infections survenant entre le 7eme jour et le 3eme mois) et des autres 
infections a SGB reste encore tres mal comprise. Le seul facteur de virulence des SGB 

30 dont le role a ete clairement demontre est le polyoside capsulaire qui permet 
l'echappement au systeme immunitaire de l'hote. La contribution exacte de certaines 
proteines de surface (antigene C, proteine Rib et C5a peptidase) a la virulence de cette 
bacterie est encore peu connue. 
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. Une recherche realisee sur le site EXPASY (http://www.expasy.ch/) indique 
qu'il existe 112 references de sequences proteiques dans les banques Swissprot et 
TREMBL. Ce nombre inclut des proteines codees par des plasmides de 5. agalactiae. 
Ces sequences represented done une vision partielle d'un nombre limite d'aspect de la 
5 biologie de S. agalactiae. La biosynthese de la capsule polysaccharidique est un des 
aspects les mieux connus de la virulence de cette bacterie. Par ailleurs, les genes codant 
pour 6 proteines exposees a la surface sont egalement connus (3). 

Afin d'apprehender de maniere globale les determinants genetiques impliques 

1 0 dans ces processus ainsi que le metabolisme de Streptococcus agalactiae, le sequen?age 
du genome de Streptococcus agalactiae a ete realise. Le genome de la souche 
Streptococcus agalactiae CIP 82.45 (ATCC 12403) qui a ete responsable d'une 
septicemic mortelle a ete choisi pour ce sequen9age. Cette souche possede un serotype 
capsulaire III, ne presente pas de resistance acquise aux antibiotiques, est genetiquement 

1 5 modifiable et est virulente dans un modele d'infection murin. La connaissance complete 
du genome est une etape cruciale pour la caracterisation des genes impliques dans le 
developpement du processus infectieux : adhesion et franchissement des structures 
epitheliales, echappement au systeme immunitaire et adaptation a des conditions de 
culture variees et souvent hostiles (pH, stress oxydatif et carences nutritionnelles), qui 

20 constituent des cibles potentielles pour de nouvelles strategies therapeutiques. La 
comparaison du genome de S. agalactiae avec ceux d f autres pathogenes a Gram positif 
{Streptococcus pyogenes, Streptococcus pneumoniae, Streptococcus mutans, 
Staphylococcus aureus, Listeria monocytogenes, ...) doit permettre d f identifier de 
nouveaux genes de virulence ainsi crue nouvelles cibles pour construire des souches de 

25 virulence attenuees et des vaccins. Les proteines de surfaces constituent des candidats 
pour une future preparation vaccinale. Dans les tableaux 2 et 6 ci-apres sont repertories 
respectivement 25 et 30 nouveaux genes, nouvellement identifies, codant pour des 
proteines potentiellement liees au peptidoglycane et presentant le motif de liaison 
LPXTG. 

30 

La sequence complete du genome de Streptococcus agalactiae (CIP 82.45 
(ATCC 12403)) a ete obtenue. Ce genome est constitue d'un chromosome long 
d'environ 2,2 Mb identifie ici sous forme de 138 contigs representes par les sequences 
SEQ ID No. 1 a SEQ ID No. 136, SEQ ID No. 138 et SEQ ID No. 139, et d'un plasmide 
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long de 45 kbases present dans la souche sequencee represents par la sequence SEQ ID 
No. 137. La sequence complete du genome est representee par la sequence SEQ ID No. 
2345. 

Une liste des phases codantes annotees identifiees par Tanalyse des sequences de 
5 ces contigs est donnee au tableau 1 . 

Une liste des phases codantes pour des prolines de surface nouvellement 
identifiees est donnee au tableau 2 comme indiquS precedemment. 

Une liste des phases codantes annotees identifiees par Tanalyse de la sequence 
genomique complete SEQ ID No. 2345 est donnee au tableau 3. 
10 Une liste des phases codantes pour des proteines de surface identifiees a partir 

de Tanalyse de la sequence genomique complete SEQ ID No. 2345 est donnee au 
tableau 6 (proteines liees au peptidoglycane), tableau 8 (lipoproteines).Tableau 9 (autres 
proteines de suface), Tableau 10( proteines impliquees dans la biosynthese des 
composes polysaccharidiques) 

15 

La presente invention concerne les sequences nucleotidiques et polypeptidiques 
de Streptococcus agalactiae CIP 82.45 (ATCC 12403). 

Ainsi, c'est un objet de la presente invention que de caracteriser la sequence du 
genome de Streptococcus agalactiae, CIP 82.45 (ATCC 12403) contenu dans la banque 
20 genomique preparee a partir du genome de cette souche et deposee a la CNCM le 28 
decembre 2000 sous le numero 1-2610, ainsi que de tous les genes et sequences 
regulatrices non codantes contenus dans ledit genome. 

La presente invention concerne done une sequence nucleotidique isolee et/ou 
purifiee de Streptococcus agalactiae, caracterisee en ce qu'elle est choisie parmi les 
25 sequences SEQ ID No. 1 a SEQ ID No. 1 39 et la sequence SEQ ID No. 2345. 

La presente invention concerne egalement une sequence nucleotidique isolee 
et/ou purifiee, issue de Streptococcus agalactiae, caracterisee en ce qu'elle est choisie 
parmi : 

a) une sequence nucleotidique comportant au moins 75 %, 80 %, 85 %, 90 %, 95 % ou 
30 98 % dMdentite avec une sequence choisie parmi SEQ ID No. 1 a SEQ ID No. 139 et 

SEQ ID No. 2345 ; 

b) une sequence nucleotidique hybridant dans des conditions de forte stringence avec 
une sequence choisie parmi SEQ ID No. 1 a SEQ ID No. 139 et SEQ ID No. 2345, 
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et comprenant au moins 20 nucleotides, de preference 25, 30, 35, 40, 50, 75, 100, 
150, 200, 250, 300, 400, 500, 750, 1000 ou 1500 nucleotides ; 

c) une sequence nucleotidique complementaire d'une sequence choisie parmi SEQ ID 
No. 1 a SEQ ID No. 139 et SEQ ID No. 2345, ou complementaire d'une sequence 

5 nucleotidique telle que definie en a), ou b), ou une sequence nucleotidique de TARN 
correspondant a l'une des sequences a) ou b) ; 

d) une sequence nucleotidique d'un fragment representatif d'une sequence choisie 
parmi SEQ ID No. 1 a SEQ ID No. 139 et SEQ ID No. 2345, ou d'un fragment 
representatif d'une sequence nucleotidique telle que definie en a), b) ou c) et 

10 comprenant au moins 20 nucleotides, de preference 25, 30, 35, 40, 50, 75, 100, 150, 
200, 250, 300, 400, 500, 750, 1000 ou 1500 nucleotides ; 

e) une sequence nucleotidique comprenant une sequence telle que definie en a), b), c) 
ou d) ; et 

f) une sequence nucleotidique telle que definie en a), b), c), d) ou e) modifiee, de 
15 preference comportant au plus 10 %, 5 %, 1 % ou 0, 5 % de nucleotides modifies par 

rapport a la sequence de reference. 

De fa9on plus particuliere, la pr^sente invention a egalement pour objet les 
sequences nucleotidiques isolees et/ou purifiees, caract^risees en ce qu'elles sont issues 
de SEQ ID No. 1 a SEQ ID No. 139 et SEQ ID No. 2345, et en ce qu'elles codent pour 
20 un polypeptide choisi parmi les polypeptides de sequence SEQ ID No. 140 a SEQ ID 
No. 2344, et SEQ ID No. 2346 a SEQ ID No. 448 1 . 

La presente invention concerne aussi de fafon plus generate les sequences 
nucleotidiques issues de SEQ ID No. 1 a SEQ ID No. 139 et SEQ ID No. 2345, et 
codant pour un polypeptide de Streptococcus agalactia, telles qu'elles peuvent etre 
25 isolees a partir de SEQ ID No. 1 a SEQ ID No. 1 39 et SEQ ID No. 2345. 

De plus, les sequences nucleotidiques isolees et/ caracterisees en ce qu'elles 
comprennent une sequence nucleotidique choisie parmi : 

a) une sequence nucleotidique codant pour un polypeptide choisi parmi les sequences 
SEQ ID No. 140 a SEQ ID No. 2344 et SEQ ID No. 2346 a SEQ ID No. 4481 ; 
30 b) une sequence nucleotidique comportant au moins 75 %,. 80 %, 85 %, 90 %, 95 % ou 
98 % d'identite avec une sequence nucleotidique codant pour un polypeptide choisi 
parmi les sequences SEQ ID No. 140 a SEQ ID No. 2344 et SEQ ID No. 2346 a SEQ 
ID No. 4481 ; 
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c) une sequence nucleotidique s'hybridant dans des conditions de forte stringence avec 
une sequence nucleotidique codant pour un polypeptide, choisi parmi les sequences 
SEQ ID No. 140 a SEQ ID No. 2344 et SEQ ID No. 2346 a SEQ ID No. 4481, et 
comprenant au moins 20 nucleotides, de preference 25, 30, 35, 40, 50, 75, 100, 150, 

5 200, 250, 300, 400, 500, 750, 1000 ou 1 500 nucleotides ; 

d) une sequence nucleotidique complementaire ou d'ARN correspondant a une 
sequence telle que definie en a), b) ou c) ; 

e) une sequence nucleotidique d'un fragment representatif d'une sequence telle que 
definie en a), b), c) ou d) et comprenant au moins 20 nucleotides, de preference 25, 

10 30, 35, 40, 50, 75, 100, 150, 200, 250, 300, 400, 500, 750, 1000 ou 1500 
nucleotides ; et 

f) une sequence telle que definie en a), b), c), d) ou e) modifiee, de preference 
comportant au plus 10 %, 5 %, 1 % ou 0,5 % de nucleotides modifies par rapport a la 
sequence de reference, 

1 5 sont egalement des objets de l ' invention. 

Selon une realisation avantageuse, l'invention a pour objet les sequences 
nucleotidiques isolees et/ caract6risees en ce qu'elles comprennent une sequence 
nucleotidique choisie parmi : 

a) une sequence nucleotidique SEQ ID No. 4482 a SEQ ID No. 66 1 7 ; 
20 b) une sequence nucleotidique comportant au moins 75 %, 80 %, 85 %, 90 %, 95 % ou 
98 % d'identite avec une sequence nucleotidique choisi parmi les sequences SEQ ID 
No. 2346 a SEQ ID No. 4481 ; 

c) une sequence nucleotidique s'hybridant dans des conditions de forte stringence avec 
une sequence nucleotidique choisi parmi les sequences SEQ ID No. 4482 a SEQ ID 

25 No. 6617, et comprenant au moins 20 nucleotides, de preference 25, 30, 35, 40, 50, 
75, 100, 150, 200, 250, 300, 400, 500, 750, 1000 ou 1500 nucleotides ; 

d) une sequence nucleotidique complementaire ou d'ARN correspondant a une 
sequence telle que definie en a), b) ou c) ; 

e) une sequence nucleotidique d'un fragment representatif d'une sequence telle que 
30 definie en a), b), c) ou d) et comprenant au moins 20 nucleotides, de preference 25, 

30, 35, 40, 50, 75, 100, 150, 200, 250, 300, 400, 500, 750, 1000 ou 1500 
nucleotides ; et 
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f) une sequence telle que definie en a), b), c), d) ou e) modifiee, de preference 
comportant au plus 10 %, 5 %, 1 % ou 0,5 % de nucleotides modifies par rapport a la 
sequence de reference, 

5 Par acide nucleique, sequence nucleique ou d'acide nucleique, polynucleotide, 

oligonucleotide, sequence de polynucleotide, sequence nucleotidique, termes qui seront 
employes indifferemment dans la presente description, on entend designer un 
enchainement precis de nucleotides, modifies ou non, permettant de definir un fragment 
ou une region d'un acide nucleique, comportant ou.non des nucleotides non naturels, et 

1 0 pouvant correspondre aussi bien a un ADN double brin, un ADN simple brin qu'a des 
produits de transcription desdits ADNs. Ainsi, les sequences nucleiques selon 
Tinvention englobent egalement les PNA (Peptid Nucleic Acid). 

II doit etre compris que la presente invention ne concerne pas les sequences 
nucleotidiques dans leur environnement chromosomique naturel, c'est-a-dire a 1'etat 

1 5 naturel. II s'agit de sequences qui ont ete isolees et/ou purifiees, c'est-a-dire qu'elles ont 
ete prelevees directement ou indirectement, par exemple par copie, leur environnement 
ayant ete au moins partiellement modifie. On entend ainsi egalement designer les acides 
nucleiques obtenus par synthese chimique. 

Par « pourcentage d'identite » entre deux sequences d'acides nucleiques ou 

20 d'acides amines au sens de la presente invention, on entend designer un pourcentage de 
nucleotides ou de residus d'acides amines identiques entre les deux sequences a 
comparer, obtenu apres le meilleur alignement, ce pourcentage etant purement 
statistique et les differences entre les deux sequences etant reparties au hasard et sur 
toute leur longueur. On entend designer par "meilleur alignement" ou "alignement 

25 optimal", l'alignement pour lequel le pourcentage d'identite determine comme ci-apres 
est le plus eleve. Les comparaisons de sequences entre deux sequences d'acides 
nucleiques ou d'acides amines sont traditionnellement realisees en comparant ces 
sequences apres les avoir alignees de maniere optimale, ladite comparaison etant 
realisee par segment ou par « fenetre de comparaison » pour identifier et comparer les 

30 regions locales de similarite de sequence. L'alignement optimal des sequences pour la 
comparaison peut etre realise, outre manuellement, au moyen de ralgorithme 
d'homologie locale de Smith et Waterman (1981, Ad. App. Math. 2:482), au moyen de 
1'algorithme d'homologie locale de Neddleman et Wunsch (1970, J. Mol. Biol. 48:443), 
au moyen de la methode de recherche de similarite de Pearson et Lipman (1988, Proc. 
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Natl. Acad. Sci. USA 85:2444), au moyen de logiciels informatiques utilisant ces 
algorithmes (GAP, BESTFIT, BLAST P, BLAST N, FASTA et TFASTA dans !e 
Wisconsin Genetics Software Package, Genetics Computer Group, 575 Science Dr., 
Madison, WI). Afin d'obtenir Palignement optimal, on utilise de preference le 
5 programme BLAST, avec la matrice BLOSUM 62. On peut egalement utiliser les 
matrices PAM ou PAM250. 

Le pourcentage d'identite entre deux sequences d'acides nucleiques ou d'acides 
amines est determine en comparant ces deux sequences alignees de maniere optimale, la 
sequence d'acides nucleiques ou d'acides amines a comparer pouvant comprendre des 

1 0 additions ou des d616tions par rapport a la sequence de reference pour un alignement 
optimal entre ces deux sequences. Le pourcentage d'identite est calcule en determinant 
le nombre de positions identiques pour lesquelles le nucleotide ou le residu d'acide 
amine est identique dans les deux sequences, en divisant ce nombre de positions 
identiques par le nombre total de positions comparees et en multipliant le resultat 

1 5 obtenu par 100 pour obtenir le pourcentage d'identite entre ces deux sequences. 

Par sequences nucleiques presentant un pourcentage d'identite d'au moins 75 %, 
de preference 80 %, 85 % ou 90 %, de fa?on plus preferee 95 % voire 98 %, apres 
alignement optimal avec une sequence de reference, on entend designer les sequences 
nucleiques presentant, par rapport a la sequence nucleique de reference, certaines 

20 modifications comme en particulier une deletion, une troncation, un allongement, une 
fusion chimerique et/ou une substitution, notamment ponctuelle, et dont la sequence 
nucleique presente au moins 75 %, de preference 80 %, 85 %, 90 %, 95 % ou 98 %, 
d'identite apres alignement optimal avec la sequence nucleique de reference. II s'agit de 
preference de sequences dont les sequences comptementaires sont susceptibles de 

25 s'hybrider specifiquement avec les sequences de reference. De preference, les 
conditions d'hybridation specifiques ou de forte stringence seront telles qu'elles 
assurent au moins 75 %, de preference 80 %, 85 %, 90 %, 95 % ou 98 % d'identite 
apres alignement optimal entre Tune des deux sequences et sa sequence 
complementaire. 

30 Une hybridation dans des conditions de forte stringence signifie que les 

conditions de temperature et de force ionique sont choisies de telle maniere qu'elles 
permettent le maintien de Phybridation entre deux fragments d'ADN complementaires. 
A titre illustratif, des conditions de forte stringence de Petape d'hybridation aux fins de 
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definir les fragments polynucleotidiques decrits ci-dessus, sont avantageusement les 
suivantes. 

L'hybridation ADN-ADN ou ADN-ARN est realisee en deux etapes : (1) 
prehybridation a 42°C pendant 3 heures en tampon phosphate (20 mM, pH 7,5) 
5 contenant 5 x SSC (1 x SSC correspond a une solution 0,15 M NaCl + 0,015 M citrate 
de sodium), 50 % de formamide, 7 % de sodium dodecyl sulfate (SDS), 10 x 
Denhardt's, 5 % de dextran sulfate et 1 % d'ADN de sperme de saumon ; (2) hybridation 
proprement dite pendant 20 heures a une temperature dependant de la taille de la sonde 
(i.e. : 42°C, pour une sonde de taille > 100 nucleotides) suivie de 2 lavages de 20 
10 minutes a 20°C en 2 x SSC + 2 % SDS, 1 lavage de 20 minutes a 20°C en 0,1 x SSC + 
0,1 % SDS. Le dernier lavage est pratique en 0,1 x SSC + 0,1 % SDS pendant 30 
minutes a 60°C pour une sonde de taille > 100 nucleotides. Les conditions d'hybridation 
de forte stringence decrites ci-dessus pour un polynucleotide de taille definie, peuvent 
etre adaptees par Thomme du metier pour des oligonucleotides de taille plus grande ou 
15 plus petite, selon Penseignement de Sambrook et al., (1989, Molecular cloning : a 
laboratory manual. 2 nd Ed. Cold Spring Harbor). 

De plus, par fragment representatif de sequences selon 1' invention, on entend 
designer tout fragment nucleotidique presentant au moins 15 nucleotides, de preference 
au moins 25, 30, 35, 40, 50, 75, 100, 150, 200, 250, 300, 400, 450, 500, 750, 1000 ou 
20 1 500 cons^cutifs de la sequence dont il est issu. 

Par fragment representatif, on entend en particulier une sequence nucleique 
codant pour un fragment biologiquement actif d'un polypeptide, tel que defini plus loin. 

Par fragment representatif, on entend egalement les sequences intergeniques, et 
en particulier les sequences nucleotidiques portant les signaux de regulation 
25 (promoteurs, terminateurs, voire enhancers, . . .). 

Parmi lesdits fragments representatifs, on prefere ceux ayant des sequences 
nucleotidiques correspondant a des cadres ouverts de lecture, denommes sequences 
ORFs (ORF pour « Open Reading Frame »), compris en general entre un codon 
d'initiation et un codon stop, ou entre deux codons stop, et codant pour des 
30 polypeptides, de preference d'au moins 100 acides amines, tel que par exemple, sans s'y 
limiter, les sequences ORFs qui seront decrites par la suite. 

La numerotation des sequences nucleotidiques ORFs qui sera utilisee par la suite 
dans la presente description correspond a la numerotation des sequences d'acides 
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amines des proteines codees par lesdites ORFs pour les peptides de sequence SEQ ID 
No. 140 a SEQ ID No. 2344 et SEQ ID No.2346 a SEQ ID No.4481. 

Les fragments representatifs selon Pinvention peuvent etre obtenus par exemple 
par amplification specifique telle que la PCR ou apres digestion par des enzymes de 
5 restriction appropries de sequences nucleotidiques selon Finvention, cette methode etant 
decrite en particulier dans l'ouvrage de Sambrook et al.. Lesdits fragments 
representatifs peuvent egalement etre obtenus par synthese chimique lorsque leur taille 
n'est pas trop importante, selon des methodes bien connues de Phomme du metier. 

Parmi les sequences contenant des sequences de Pinvention, ou des fragments 
10 representatifs, on entend egalement les sequences qui sont naturellement encadrees par 
des sequences qui presentent au moins 75 %, 80 %, 85 %, 90 %, 95 % ou 98 % 
d'identite avec les sequences selon Pinvention. 

Par sequence nucleotidique modifiee, on entend toute sequence nucleotidique 
obtenue par mutagenese selon des techniques bien connues de Phomme du metier, et 
15 comportant des modifications par rapport aux sequences normales, par exemple des 
mutations dans les sequences regulatrices et/ou promotrices de Pexpression du 
polypeptide, notamment conduisant a une modification du taux d'expression ou de 
P activity dudit polypeptide. 

Par sequence nucleotidique modifiee, on entend egalement toute sequence 
20 nucleotidique codant pour un polypeptide modifie tel que definit ci-apres. 

Concernant les sequences nucleiques ou ORF codant pour les peptides de 
sequence SEQ ID No. 2346 a SEQ ID No. 4481, ces sequences nucleiques ou ORF sont 
representees respectivement par les sequences SEQ ID No. 4482 a SEQ ID No. 6617. 

L' invention conceme avantageusement une sequence nucleotidique isolee de 
25 Streptococcus agalactiae, caracterisee en ce qu'elle est choisie parmi : 

a) une sequence choisie parmi les sequences SEQ ID N° 
6 1 94,6236,5497,579 1 ,5 1 03,4705,56 1 0,5234,4926,633 1 ,6247,5842,574 1 ,492 1 ,5090, 
5 1 80,4706,4708,5677,6246,64 1 1 ,5578,6446,6447,5607,6209,621 5,5406,5658,4965, de 
preference parmi les sequences SEQ ID N°4926,633 1,5491,5234,6246,5842 ; 
30 b) une sequence nucleotidique comportant au moins 75 % d'identite avec une 

sequence nucleotidique du a) ; 

c) une sequence nucleotidique s'hybridant dans des conditions de forte 
stringence avec une sequence nucleotidique du a) ou b) et comprenant au moins 20 
nucleotides ; 
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d) une sequence nucleotidique complementaire ou d'ARN correspondant a une 
sequence telle que definie en a), b) ou c) ; 

e) une sequence nucleotidique d'un fragment representatif d'une sequence telle 
que definie en a), b), c) ou d) et comprenant au moins 20 nucleotides ; et 

5 f) une sequence telle que definie en a), b), c), d) ou e) modifiee et comportant 

au plus 10 % de nucleotides modifies par rapport a la sequence de reference ; 

et en ce qu'elle code pour une proteine de surface avec un motif d'ancrage 
LPXTG. 

L' invention concerne egalement les polypeptides codes par ces sequences. 
10 L' invention concerne egalement avantageusement une sequence nucleotidique 

isolee de Streptococcus agalactiae caracterisee en ce qu'elle est choisie parmi les 
sequences SEQ ID 

N%035,6137,6335,6377,6386,4495,4596,4636,4730,4816^ 

5247, 5306,5417,5450,5486,5559,5591,5677,5732,5799,5800,5861,5923; et en ce 

15 qu'elle code pour une lipoproteins L'invention concerne egalement les polypeptides 
codes par ces sequences. 

L'invention concerne egalement avantageusement une sequence nucleotidique 
isolee de Streptococcus agalactiae, caracterisee en ce qu'elle est choisie parmi les 
sequences SEQ ID 

20 N°4861,6214,6061,6517,6518,6519,4743,6343,6342,5326,4952,5619,5618,5617,561^ 
5615,5614,5613,5611,5696,5971,5233,5602,5156,5574,5573,5654,5656,5526,5527,552 
9,5534,5625,5626,6223,6229,6230,6231,6232,6233,5764,6095,5089,5466,5465 ; et en 
ce qu'elle code pour une proteine impliquee dans la biosynthese de composes 
polysaccharidiques de paroi. L'invention concerne egalement les polypeptides codes par 

25 . ces sequences. 

Les fragments representatifs selon l'invention peuvent egalement etre des sondes 
ou amorces, qui peuvent etre utilisees dans des procedes de detection, d' identification, 
de dosage ou d'amplification de sequences nucleiques. 

Une sonde ou amorce se definit, au sens de l'invention, comme etant un 

30 fragment d'acides nucleiques simple brin ou un fragment double brin denature 
comprenant par exemple de 12 bases a quelques kb, notamment de 15 a quelques 
centaines de bases, de preference de 15 a 50 ou 100 bases, et possedant une specificite 
d'hybridation dans des conditions determinees pour former un complexe d'hybridation 
avec un acide nucleique cible. 
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Les sondes et amorces selon I'invention peuvent etre marquees directement ou 
indirectement par un compose radioactif ou non radioactif par des methodes bien 
connues de Phomme du metier, afin d'obtenir un signal detectable et/ou quantifiable 
(brevet FR 78 10975 et bDNA de Chiron EP 225 807 et EP 510 085). 
5 Les sequences non marquees de polynucleotides selon T invention peuvent etre 

utilisees directement comme sonde ou amorce. 

Les sequences sont generalement marquees pour obtenir des sequences 
utilisablcs pour de nombreuses applications. Le marquage des amorces ou des sondes 
scion I'invention est realise par des elements radioactifs ou par des molecules non 
10 radioactives. 

Parmi les isotopes radioactifs utilises, on peut citer le 32 P, le 33 P, le 35 S, le 3 H ou 
Ic l2 \ Les entites non radioactives sont selectionnees parmi les ligands tels la biotine, 
lavidinc. la streptavidine, la dioxygenine, les haptenes, les colorants, les agents 
luminescent* tels que les agents radioluminescents, chemoluminescents, 

1 5 bioluminescenls, fluorescents, phosphorescents. 

Les polynucleotides selon I'invention peuvent ainsi etre utilises comme amorce 
et/ou sonde dans des procedes mettant en oeuvre notamment la technique de PCR 
(amplification en chaine par polymerase) (Rolfs et al., 1991, Berlin : Springer- Verlag). 
Cctte technique necessite le choix de paires d'amorces oligonucleotidiques encadrant le 

20 fragment qui doit etre amplifie. On peut, par exemple, se referer a la technique decrite 
dans le brevet americain U.S. N° 4,683,202. Les fragments amplifies peuvent etre 
identifies, par exemple apres une electrophorese en gel d'agarose ou de polyacrylamide, 
ou apres une technique chromatographique comme la filtration sur gel ou la 
chromatographie echangeuse d'ions, puis sequences. La specificite de V amplification 

25 peut etre controlee en utilisant les sequences nucleotidiques de polynucleotides de 
P invention comme matrice, des plasmides contenant ces sequences ou encore les 
produits d'amplification derives. Les fragments nucleotidiques amplifies peuvent etre 
utilises comme reactifs dans des reactions d'hybridation afin de mettre en evidence la 
presence, dans un echantillon biologique, d'un acide nucleique cible de sequence 

30 complementaire a celle desdits fragments nucleotidiques amplifies. 

L 5 invention vise egalement les acides nucleiques susceptibles d'etre obtenus par 
amplification a l'aide d'amorces selon Tinvention. 

D'autres techniques d'amplification de Tacide nucleique cible peuvent etre 
avantageusement employees comme alternative a la PCR (PCR-like) a l'aide de couple 
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d'amorces de sequences nucleotidiques selon Pinvention. Par PCR-like on entend 
designer toutes les methodes mettant en oeuvre des reproductions directes ou indirectes 
des sequences d'acides nucleiques, ou bien dans lesquelles les systemes de marquage 
ont ete amplifies, ces techniques sont bien entendu connues. En general il s'agit de 
5 Pamplification de PADN par une polymerase ; lorsque Pechantillon d'origine est un 
ARN il convient prealablement d'effectuer une transcription reverse. II existe 
actuellement de tres nombreux procedes permettant cette amplification, comme par 
exemple la technique SDA (Strand Displacement Amplification) ou technique 
d'amplification a deplacement de brin (Walker et ah, 1992, Nucleic Acids Res. 

10 20:1691), la technique TAS (Transcription-based Amplification System) decrite par 
Kwoh et al. (1989, Proc. Natl. Acad. Sci., USA, 86, 1173), la technique 3SR (Self- 
Sustained Sequence Replication) decrite par Guatelli et al. (1990, Proc. Natl. Acad. Sci., 
USA 87:1874), la technique NASBA (Nucleic Acid Sequence Based Amplification) 
decrite par Kievitis et al. (1991, J. Virol. Methods, 35, 273), la technique TMA 

15 (Transcription Mediated Amplification), la technique LCR (Ligase Chain Reaction) 
decrite par Landegren et al. (1988, Science 241, 1077), la technique de RCR (Repair 
Chain Reaction) decrite par Segev (1992, Kessler C. Springer Verlag, Berlin, New- 
York, 197-205), la technique CPR (Cycling Probe Reaction) decrite par Duck et al. 
(1990, Biotechniques, 9, 142), la technique d'amplification a la Q-beta-replicase decrite 

20 par Miele et al. (1983, J. Mol. Biol., 171, 281). Certaines de ces techniques ont depuis 
cte perfectionn6es. 

Dans le cas oil le polynucleotide cible a detecter est un ARNm, on utilise 
avantageusement, prealablement a la mise en oeuvre d'une reaction d' amplification a 
Paide des amorces selon Pinvention ou a la mise en oeuvre d'un procede de detection a 

25 Paide des sondes de Pinvention, une enzyme de type transcriptase inverse afin d'obtenir 
un ADNc a partir de PARNm contenu dans Pechantillon biologique. L'ADNc obtenu 
servira alors de cible pour les amorces ou les sondes mises en oeuvre dans le procede 
d'amplification ou de detection selon l'invention. 

La technique d'hybridation de sondes peut etre realisee de manieres diverses 

30 (Matthews et al., 1988, Anal. Biochem., 169, 1-25). La methode la plus generate 
consiste a immobiliser Pacide nucleique extrait des cellules de differents tissus ou de 
cellules en culture sur un support (tels que la nitrocellulose, le nylon, le polystyrene) et 
a incuber, dans des conditions bien definies, Pacide nucleique cible immobilise avec la 
sonde. Apres Phybridation, Pexces de sonde est elimine et les molecules hybrides 
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formees sont detectees par la methode appropriee (mesure de la radioactivite, de la 
fluorescence ou de Pactivite enzymatique liee a la sonde). 

Selon un autre mode de raise en oeuvre des sondes nucleiques selon Pinvention, 
ces dernieres peuvent etre utilisees comme sondes de capture. Dans ce cas, une sonde, 
5 dite « sonde de capture », est immobilisee sur un support et sert a capturer par 
hybridation specifique Pacide nucleique cible obtenu a partir de Pechantillon biologique 
a tester et Pacide nucleique cible est ensuite detect^ grace a une seconde sonde, dite 
« sonde de detection », marquee par un element facilement detectable. 

Parmi les fragments d'acides nucleiques interessants, il faut ainsi citer en 

10 particulier les oligonucleotides anti-sens, c'est-a-dire dont la structure assure, par 
hybridation avec la sequence cible, une inhibition de Pexpression du produit 
correspondant. II faut egalement citer les oligonucleotides sens qui, par interaction avec 
des proteines impliquees dans la regulation de Pexpression du produit correspondant, 
induiront soit une inhibition, soit une activation de cette expression. 

15 De fa^on preferee, les sondes ou amorces selon Pinvention sont immobilisees 

sur un support, de maniere covalente ou non covalente. En particulier, le support peut 
etre une puce a ADN ou un filtre a haute ou moyenne densite, egalement objets de la 
presente invention (brevets WO 97/29212, WO 98/27317, WO 97/10365 et WO 
92/10588). 

20 On entend designer par puce a ADN ou filtre haute densite, un support sur lequel 

sont fixees des sequences d'ADN, chacune d'entre elles pouvant etre reperee par sa 
localisation geographique. Ces puces ou filtres different principalement par leur taille, le 
materiau du support, et eventuellement le nombre de sequences d'ADN qui y sont 
fixees. 

25 On peut fixer les sondes ou amorces selon la premiere invention sur des supports 

solides, en particulier les puces a ADN, par differents procedes de fabrication. En 
particulier, on peut effectuer une synthese in situ par adressage photochimique ou par jet 
d'encre. D'autres techniques consistent a effectuer une synthese ex situ et a fixer les 
sondes sur le support de la puce a ADN par adressage mecanique, electronique ou par 

30 jet d'encre. Ces differents procedes sont bien connus de Phomme du metier. 

Une sequence nucleotidique (sonde ou amorce) selon Pinvention permet done la 
detection et/ou Pamplification de sequences nucleiques specifiques. En particulier, la 
detection de cesdites sequences est facilitee lorsque la sonde est fixee sur une puce a 
ADN, ou a un filtre haute densite. 
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L'utilisation de puces a ADN ou de filtres a haute densite permet en effet de 
determiner P expression de genes dans un organisme presentant une sequence 
genomique proche de Streptococcus agalactiae et le typage de la souche en cause. 

La sequence genomique de Streptococcus agalactiae, completee par 
5 Identification des genes de ces organismes, telle que presentee dans la presente 
invention, sert de base a la construction de ces puces a ADN ou filtre. 

La preparation de ces filtres ou puces consiste a synthetiser des oligonucleotides, 
correspondant aux extremites 5' et 3' des genes ou a des fragments plus internes pour 
amplifier des fragments d'une taille adaptee, par exemple comprise environ entre 300 et 

10 800 bases. Ces oligonucleotides sont choisis en utilisant la sequence genomique et ses 
annotations divulguees par la presente invention. La temperature d'appariement des ces 
oligonucleotides aux places correspondantes sur PADN doit etre approximativement la 
meme pour chaque oligonucleotide. Ceci permet de preparer des fragments d'ADN 
correspondant a chaque gene par Putilisation de conditions de PCR appropriees dans un 

15 environnement hautement automatise. Les fragments amplifies sont ensuite immobilises 
sur des filtres ou des supports en verre, silicium ou polymeres synthetiques et ces 
milieux sont utilises pour Phybridation. 

La disponibilite de tels filtres et/ou puces et de la sequence genomique 
correspondante annotee permet d'etudier 1'expression de grands ensembles, voire de la 

20 totalite des genes dans les micro-organismes associes a Streptococcus agalactiae et 
Streptococcus agalactiae CIP 82.45 (ATCC 12403), en preparant les ADNs 
complementaires, et en les hybridant a l'ADN ou aux oligonucleotides immobilises sur 
les filtres ou les puces. De meme, les filtres et/ou les puces permettent d'etudier la 
variability des souches ou des especes, en preparant l'ADN de ces organismes et en les 

25 hybridant a l'ADN ou aux oligonucleotides immobilises sur les filtres ou les puces. 

Les differences entre les sequences genomiques des differentes souches ou 
especes peuvent grandement affecter 1'intensite de I'hybridation et, par consequent, 
perturber Interpretation des resultats. II peut done etre necessaire d'avoir la sequence 
precise des genes de la souche que Ton souhaite etudier. La methode de detection des 

30 genes decrite plus loin en detail, impliquant la determination de la sequence de 
fragments aleatoires d'un genome, et les organisant d'apres la sequence du genome de 
Streptococcus agalactiae, notamment de Streptococcus agalactiae CIP 82.45 (ATCC 
12403) divulguee dans la presente invention, peut etre tres utile. 
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Les sequences nucleotidiques selon l'invention peuvent etre utilisees dans des 
puces a ADN pour effectuer l'analyse de mutations. Cette analyse repose sur la 
constitution de puces capables d'analyser chaque base d'une sequence nucleotidique 
selon 1' invention. On pourra notamment a cette fin mettre en oeuvre les techniques de 
5 microsequen9age sur puce a ADN. Les mutations sont d&ectees par extension 
d'amorces immobilisees hybridant a la matrice des sequences analyses, juste en 
position adjacente de celle du nucleotide mute recherche. Une matrice simple brin, ARN 
ou ADN, des sequences a analyser sera avantageusement preparee selon des methodes 
classiques, a partir de produits amplifies selon les techniques de type PCR. Les matrices 

10 d f ADN simple brin, ou d'ARN ainsi obtenues sont alors deposees sur la puce a ADN, 
dans des conditions permettant leur hybridation specifique aux amorces immobilisees. 
Une polymerase thermostable, par exemple la Tth ou la Taq ADN polymerase, etend 
specifiquement Textremite 3' de l'amorce immobilisee avec un analogue de nucleotide 
marque complementaire du nucleotide en position du site variable ; par exemple, un 

1 5 cyclage thermique est realise en presence des dideoxyribonucleotides fluorescents. Les 
conditions experimentales seront adaptees notamment aux puces employees, aux 
amorces immobilisees, aux polymerases employees, et au systeme de marquage choisi. 
Un avantage du microsequen9age, par rapport aux techniques basees sur Thybridation 
de sondes, est qu'il permet d'identifier tous les nucleotides variables avec une 

20 discrimination optimale dans des conditions de reactions homogenes ; utilise sur des 
puces a ADN, il permet une resolution et une specificity optimales pour la detection 
routiniere et industrielle de mutations en multiplex. 

Une puce a ADN ou un filtre peut etre un outil extremement interessant pour la 
determination, la detection et/ou P identification d'un micro-organisme. Ainsi, on 

25 prefere egalement les puces a ADN selon l'invention qui contiennent en outre au moins 
une sequence nucleotidique d'un micro-organisme autre que Streptococcus agalactiae 
CIP 82.45 (ATCC 12403) ou Streptococcus agalactiae, immobilisee sur le support de 
ladite puce. De preference, le micro-organisme choisi Test parmi les bacteries du genre 
Streptococcus (ci-apres designees comme bacteries associees a Streptococcus 

30 agalactiae), ou les variants de Streptococcus agalactiae CIP 82.45 (ATCC 1 2403). 

Une puce a ADN ou un filtre selon l'invention est un element tres utile de 
certains kits ou necessaires pour la detection et/ou P identification de micro-organismes, 
en particulier les bacteries appartenant a Pespece Streptococcus agalactiae ou les 
micro-organismes associes, egalement objets de l'invention. 
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Par ailleurs, les puces a ADN ou les filtres selon l'invention, contenant des 
sondes ou amorces specifiques de Streptococcus agalactiae, sont des elements tres 
avantageux de kits ou necessaires pour la detection et/ou la quantification de 
P expression de genes de Streptococcus agalactiae (ou de micro-organismes associes). 
5 En effet, le controle de l'expression des genes est un point critique pour 

optimiser la croissance et le rendement d'une souche, soit en permettant l'expression 
d'un ou plusieurs genes nouveaux, soit en modifiant l'expression de genes deja presents 
dans la cellule. La presente invention fournit l'ensemble des sequences naturellement 
actives chez Streptococcus agalactiae permettant l'expression des genes. Elle permet 

10 ainsi la determination de Tensemble des sequences exprimees chez Streptococcus 
agalactiae. Elle fournit egalement un outil permettant de reperer les genes dont 
l'expression suit un schema donne. Pour realiser cela, l'ADN de tout ou partie des genes 
de Streptococcus agalactiae peut etre amplifie grace a des amorces selon l'invention, 
puis fixe a un support comme par exemple le verre ou le nylon ou une puce a ADN, afin 

15 de construire un outil permettant de suivre le profil d'expression de ces genes. Cet outil, 
constitue de ce support contenant les sequences codantes sert de matrice d'hybridation a 
un melange de molecules marquees refletant les ARNs messagers exprimes dans la 
cellule (en particulier les sondes marquees selon 1 'invention). En repetant cette 
experience a differents instants et en combinant Tensemble de ces donnees par un 

20 traitement approprie, on obtient alors les profils d'expression de l'ensemble de ces 
genes. La connaissance des sequences qui suivent un schema de regulation donne peut 
aussi etre mise a profit pour rechercher de maniere dirigee, par exemple par homologie, 
d'autres sequences suivant globalement, mais de maniere legerement differente le meme 
schema de regulation. En complement, il est possible d'isoler chaque sequence de 

25 controle presente en amont des segments servant de sondes et d'en suivre Tactivite a 
Taide de moyen approprie comme un gene rapporteur (luciferase, (J-galactosidase, 
GFP). Ces sequences isolees peuvent ensuite etre modifiees et assemblies par ingenierie 
metabolique avec des sequences d'interet en vue de leur expression optimale. 

L'invention concerne egalement les polypeptides codes par une sequence 

30 nucleotidique selon l'invention, de preference, par un fragment representatif des 
sequences precedentes et correspondant a une sequence ORF. En particulier, les 
polypeptides de Streptococcus agalactiae CEP 82.45 (ATCC 12403) de SEQ ID No. 140 
a SEQ ID No. 2344 et SEQ ID No. 2346 a SEQ ID No. 4481 sont objet de l'invention. 
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L'invention comprend egalement les polypeptides caracterises en ce qu'ils 
comprennent un polypeptide choisi parmi : 

a) un polypeptide selon l'invention ; 

b) un polypeptide presentant au moins 80 % de preference 85 %, 90 %, 95 % et 98 % 
5 d'identite avec un polypeptide selon Finvention ; 

c) un fragment d'au moins 5 acides amines, de preference d'au moins 10, 15, 20, 25, 
30, 40, 50, 75 et 100 acides amines d'un polypeptide selon l'invention, ou tel que 
defini en b) ; 

d) un fragment biologiquement actif d'un polypeptide selon l'invention, ou tel que 
1 0 defini en b) ou c) ; et 

e) un polypeptide selon l'invention, ou tel que defini en b), c) ou d) modifie et 
comportant au plus 10 %, 5 % ou 1 % d'acides amines modifies par rapport a la 
sequence de reference. 

Les sequences nucleotidiques codant pour les polypeptides decrits 
1 5 precedemment sont egalement objet de l'invention. 

Dans la presente description, les termes polypeptides, sequences 
polypeptidiques, peptides et proteines sont interchangeables. Le terme polypeptide 
comprend toute sequence d'acides amines permettant de generer une reponse anticorps. 

II doit etre compris que l'invention ne concerne pas les polypeptides sous forme 
20 naturelle, c'est-a-dire qu'ils ne sont pas pris dans leur environnement naturel. En 
revanche, elle concerne ceux qui ont pu etre isoles ou obtenus par purification a partir 
de sources naturelles, ou bien obtenus par recombinaison genetique, ou par synthese 
chimique, et qu'ils peuvent alors comporter des acides amines non naturels comme cela 
sera decrit plus loin. 

25 Par polypeptide presentant un certain pourcentage d'identite avec un autre, que 

Ton designera Egalement par polypeptide homologue, on entend designer les 
polypeptides presentant par rapport aux polypeptides naturels, certaines modifications, 
en particulier une deletion, addition ou substitution d'au moins un acide amine, une 
troncation, un allongement, une solution chimerique et/ou une mutation, ou les 

30 polypeptides presentant des modifications post-traductionnelles. Parmi les polypeptides 
homologues, on prefere ceux dont la sequence d'acides amines presentent au moins 
80 %, de preference 85 %, 90 %, 95 % et 98 % d'homologie avec les sequences 
d'acides amines des polypeptides selon l'invention. Dans le cas d'une substitution, un 
ou plusieurs acide(s) amine(s) consecutif(s) ou non cons6cutif(s) sont remplaces par des 
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acides amines « equivalents ». L'expression « acides amines equivalents » vise ici a 
designer tout acide amine susceptible d'etre substitue a Tun des acides amines de la 
structure de base sans cependant modifier essentiellement les activites biologiques des 
peptides correspondant telles qu'elles seront definies par la suite. 
5 Ces acides amines equivalents peuvent etre determines soit en s'appuyant sur 

leur homologie de structure avec les acides amines auxquels ils se substituent, soit sur 
des resultats d'essais comparatifs d'activite biologique entre les differents polypeptides 
susceptibles d'etre effectues. 

A titre d'exemple, on mentionne les possibilites de substitution susceptibles 

10 d'etre effectuees sans qu'il r^sulte en une modification approfondie de l'activite 
biologique du polypeptide modifie correspondant. On peut remplacer ainsi la leucine 
par la valine ou l'isoleucine, 1'acide aspartique par Tacide glutamine, la glutamine par 
1'asparagine, l'arginine par la lysine, etc., les substitutions inverses etant naturellement 
envisageables dans les memes conditions. 

1 5 Les polypeptides homologies correspondent egalement aux polypeptides codes 

par les sequences nucleotidiques homologues ou identiques, telles que definies 
precedemment et comprennent ainsi dans la presente definition des polypeptides mutes 
ou correspondant a des variations inter ou intra especes, pouvant exister chez 
Streptococcus, et qui correspondent notamment a des troncatures, substitutions, 

20 deletions et/ou additions, d'au moins un residu d'acides amines. 

II est entendu que Ton calcule le pourcentage d'identite entre deux polypeptides 
de la meme fa9on qu'entre deux sequences d'acides nucleiques. Ainsi, le pourcentage 
d'identite entre deux polypeptides est calcule apres alignement optimal de ces deux 
sequences, sur une fenetre d'homologie maximale. Pour definir ladite fenetre 

25 d'homologie maximale, on peut utiliser les memes algorithmes que pour les sequences 
d'acide nucleique. 

Par fragment biologiquement actif d'un polypeptide selon 1' invention, on entend 
designer en particulier un fragment de polypeptide, tel que defini ci-apres, presentant au 
moins une des caracteristiques biologiques des polypeptides selon 1' invention, 
30 notamment en ce qu'il est capable d'exercer de maniere generate une activite meme 
partielle, telle que par exemple : 

- une activite enzymatique (metabolique) ou une activite pouvant etre 
impliquee dans la biosynthese ou la biodegradation de composes organiques ou 
inorganiques ; 
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- une activite structurelle (enveloppe cellulaire, molecule chaperonne, 
ribosome) ; 

- une activite de transport (d'energie, d'ion) ; ou dans la secretion de proteine ; 

- une activite dans le processus de replication, amplification, preparation, 
5 transcription, traduction ou maturation, notamment de PADN, de TARN ou des 

proteines. 

Par fragment de polypeptide selon Pinvention, on entend designer un 
polypeptide comportant au minimum 5 acides amines, de preference d'au moins 10, 15, 
20, 25, 30, 40, 50, 75, 100 et 150 acides amines. 

10 Les fragments de polypeptides peuvent correspondre a des fragments isoles ou 

purifies naturellement presents dans les souches de Streptococcus, ou a des fragments 
qui peuvent etre obtenus par clivage dudit polypeptide par une enzyme proteolitique 
telle que la trypsine ou la chymotrypsine ou la collagenase, par un reactif chimique 
(bromure de cyanogene, CNBr) ou en pla9ant ledit polypeptide dans un environnement 

15 tres acide (par exemple a pH = 2,5). Des fragments polypeptidiques peuvent egalement 
etre prepares par synthese chimique, a partir d'hotes transformes par un vecteur 
d'expression selon Pinvention qui contiennent un acide nucleique permettant 
l'expression dudit fragment, et place sous le controle des elements de regulation et/ou 
d'expression appropries. 

20 Par « polypeptide modifie» d'un polypeptide selon Pinvention, on entend 

designer un polypeptide obtenu par recombinaison genetique ou par synthese chimique 
comme decrit plus loin, qui presente au moins une modification par rapport a la 
sequence normale. Ces modifications peuvent etre notamment portees sur des acides 
amines necessaires pour la specificite ou Pefficacite de Pactivite, ou a l'origine de la 

25 conformation structural, de la charge, ou de Phydrophobicite du polypeptide selon 
Pinvention. On peut ainsi creer des polypeptides d'activite equivalente, augmentee ou 
diminuee, ou de specificite equivalente, plus etroite ou plus large. Parmi les 
polypeptides modifies, il faut citer les polypeptides dans lesquels jusqu'a cinq acides 
amines peuvent etre modifies, tronques a Pextr^mite N ou C-terminale, ou bien deletes, 

30 ou ajoutes. 

Comme cela est indique, les modifications d'un polypeptide ont pour objectif 
notamment : 

- de permettre sa mise en oeuvre dans des precedes de biosynthese ou de 
biodegradation de composes organiques ou inorganiques, 
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- de permettre sa mise en oeuvre dans des precedes de replication, 
d' amplification, de reparation et regie de transcription, de traduction, ou de maturation 
notamment de PADN, TARN, ou de proteines, 

- de permettre sa secretion amelioree, 

5 -de modifier sa solubilite, Pefficacite ou la specificite de son activite, ou 

encore de faciliter sa purification. 

La synthese chimique presente egalement Favantage de pouvoir utiliser des 
acides amines non naturels ou des liaisons non peptidiques. Ainsi, il peut etre 
interessant d'utiliser des acides amines non naturels, par exemple sous forme D, ou des 
10 analogues d'acides amines, notamment des formes souffrees. 

La presente invention fournit la sequence nucleotidique du genome de 
Streptococcus agalactiae CIP 82.45 (ATCC 12403) sous forme de contigs, ainsi que 
certaines sequences polypeptidiques. 

D'une maniere preferee, Finvention est relative a une sequence nucleotidique 
15 selon F invention, caracterisee en ce qu'elle code pour un polypeptide de Streptococcus 
agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique dans la 
biosynthese des acides amines. 

De maniere preferee, Pinvention est relative a une sequence nucleotidique selon 
Pinvention, caracterisee en ce qu'elle code pour un polypeptide de Streptococcus 
20 agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique dans la 
biosynthese des cofacteurs, groupes prosthetiques et transporters. 

De maniere preferee, Pinvention est relative a une sequence nucleotidique selon 
Pinvention, caracterisee en ce qu'elle code pour un polypeptide d'enveloppe cellulaire 
ou present a la surface de Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou pour 
25 un de ses fragments. 

De maniere preferee, Pinvention est relative a une sequence nucleotidique selon 
Pinvention, caracterisee en ce qu'elle code pour un polypeptide de Streptococcus 
agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique dans la 
machinerie cellulaire. 

30 De maniere preferee, Pinvention est relative a une sequence nucleotidique selon 

Pinvention, caracterisee en ce qu'elle code pour un polypeptide de Streptococcus 
agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique dans le 
metabolisme intermediate central. 
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De maniere preferee, Tinvention est relative a une sequence nucleotidique selon 
Tinvention, caracterisee en ce qu'elle code pour un polypeptide de Streptococcus 
agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique dans le 
metabolisme energetique. 
5 De maniere preferee, Tinvention est relative a une sequence nucleotidique selon 

Tinvention, caracterisee en ce qu'elle code pour un polypeptide de Streptococcus 
agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique dans le 
metabolisme des acides gras et des phospholipides. 

De maniere preferee, Tinvention est relative a une sequence nucleotidique selon 
10 Tinvention, caracterisee en ce qu'elle code pour un polypeptide de Streptococcus 
agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique dans le 
metabolisme des nucleotides, des purines, des pyrimidines ou nucleosides. 

De maniere preferee, Tinvention est relative a une sequence nucleotidique selon 
Tinvention, caracterisee en ce qu'elle code pour un polypeptide de Streptococcus 
15 agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique dans les 
fonctions de regulation. 

De maniere preferee, Tinvention est relative a une sequence nucleotidique selon 
Tinvention, caracterisee en ce qu'elle code pour un polypeptide de Streptococcus 
agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique dans le processus 
20 de replication. 

De maniere preferee, Tinvention est relative a une sequence nucleotidique selon 
Tinvention, caracterisee en ce qu'elle code pour un polypeptide de Streptococcus 
agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique dans le processus 
de transcription. 

25 De maniere preferee, Tinvention est relative a une sequence nucleotidique selon 

Tinvention, caracterisee en ce qu'elle code pour un polypeptide de Streptococcus 
agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique dans le processus 
de traduction. 

De maniere preferee, Tinvention est relative a une sequence nucleotidique selon 
30 Tinvention, caracterisee en ce qu'elle code pour un polypeptide de Streptococcus 
agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique dans le processus 
de transport et de liaison des proteines. 

De maniere preferee, Tinvention est relative a une sequence nucleotidique selon 
Tinvention, caracterisee en ce qu'elle code pour un polypeptide de Streptococcus 
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agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique dans Padaptation 
aux conditions atypiques. 

De maniere preferee, T invention est relative a une sequence nucleotidique selon 
I' invention, caracterisee en ce qu'elle code pour un polypeptide de Streptococcus 
5 agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments dans la sensibilite aux 
medicaments et analogues. 

De maniere preferee, P invention est relative a une sequence nucleotidique selon 
1'invcntion. caracterisee en ce qu'elle code pour un polypeptide de Streptococcus 
agalactiae CIP 82.45 (ATCC ,12403) ou un de ses fragments implique dans les 
10 functions relatives aux transposons. 

De maniere preferee, Pinvention est relative a une sequence nucleotidique selon 
Pinvention. caracterisee en ce qu'elle code pour un polypeptide specifique de 
Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments. 

Sous un autre aspect, de maniere preferee, 1' invention a pour objet un 
15 polypeptide selon Pinvention, caracterise en ce qu'il s'agit d'un polypeptide de 
Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique 
dans la biosynthese des acides amines. 

Sous un autre aspect, de maniere preferee, Pinvention a pour objet un 
polypeptide selon Pinvention, caracterise en ce qu'il s'agit d'un polypeptide de 
20 Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique 
dans la biosynthese des cofacteurs, groupes prosthetiques et transporters. 

Sous un autre aspect, de maniere preferee, Pinvention a pour objet un 
polypeptide selon Pinvention, caracterise en ce qu'il s'agit d'un polypeptide 
d'enveloppe cellulaire ou de surface de Streptococcus agalactiae CIP 82.45 (ATCC 
25 1 2403) ou un de ses fragments. 

Sous un autre aspect, de maniere preferee, Pinvention a pour objet un 
polypeptide selon Pinvention, caracterise en ce qu'il s'agit d'un polypeptide de 
Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique 
dans la machinerie cellulaire. 
30 Sous un autre aspect, de maniere preferee, Pinvention a pour objet un 

polypeptide selon Pinvention, caracterise en ce qu'il s'agit d'un polypeptide de 
Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique 
dans le metabolisme intermediate central. 
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Sous un autre aspect, de maniere preferee, P invention a pour objet un 
polypeptide selon Pinvention, caracterise en ce qu'il s'agit d'un polypeptide de 
Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique 
dans le metabolisme energetique. 
5 Sous un autre aspect, de maniere preferee, Pinvention a pour objet un 

polypeptide selon Pinvention, caracterise en ce qu'il s'agit d'un polypeptide de 
Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique 
dans le metabolisme des acides gras et des phospholipides. 

Sous un autre aspect, de maniere preferee, Pinvention a pour objet un 
10 polypeptide selon Pinvention, caracterise en ce qu'il s'agit d'un polypeptide de 
Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique 
dans le metabolisme des nucleotides, des purines, des pyrimidines ou nucleosides. 

Sous un autre aspect, de maniere preferee, Pinvention a pour objet un 
polypeptide selon Pinvention, caracterise en ce qu'il s'agit d'un polypeptide de 
15 Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique 
dans les fonctions de regulation. 

Sous un autre aspect, de maniere preferee, Pinvention a pour objet un 
polypeptide selon Pinvention, caracterise en ce qu'il s'agit d'un polypeptide de 
Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique 
20 dans le processus de replication. 

Sous un autre aspect, de maniere preferee, Pinvention a pour objet un 
polypeptide selon Pinvention, caracterise en ce qu'il s'agit d'un polypeptide de 
Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique 
dans le processus de transcription. 
25 Sous un autre aspect, de maniere preferee, Pinvention a pour objet un 

polypeptide selon Pinvention, caracterise en ce qu'il s'agit d'un polypeptide de 
Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique 
dans le processus de traduction. 

Sous un autre aspect, de maniere preferee, Pinvention a pour objet un 
30 polypeptide selon Pinvention, caracterise en ce qu'il s'agit d'un polypeptide de 
Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique 
dans le processus de transport et de liaison des proteines. 

Sous un autre aspect, de maniere preferee, Pinvention a pour objet un 
polypeptide selon Pinvention, caracterise en ce qu'il s'agit d'un polypeptide de 
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Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique 
dans l'adaptation aux conditions atypiques. 

Sous un autre aspect, de maniere preferee, l'invention a pour objet un 
polypeptide selon l'invention, caracterise en ce qu'il s'agit d'un polypeptide de 
5 Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments dans la 
sensibilite aux medicaments et analogues. 

Sous un autre aspect, de maniere preferee, l'invention a pour objet un 
polypeptide selon l'invention, caracterise en ce qu'il s'agit d'un polypeptide de 
Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique 
1 0 dans les fractions relatives aux transposons. 

Sous un autre aspect, de maniere preferee, l'invention a pour objet un 
polypeptide selon l'invention, caracterise en ce qu'il s'agit d'un polypeptide specifique 
de Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments. 

L'invention a egalement pour objet les operons impliques dans la synthese 
1 5 d'antibiotiques et/ou de toxines. 

Le tableau 1 fournit la liste de certains polypeptides selon 1' invention, ainsi que 
leur localisation dans les sequences SEQ ID No. 1 a SEQ ID No. 139, et les analogies 
observees apres comparaison dans les bases de donnees. 

20 II est important de noter toutefois qu'un organisme vivant est un tout et doit etre 

pris comme tel. Ainsi, afin de pouvoir se developper et exhiber ses proprietes, tout 
organisme a besoin d' interactions entre les differentes voies metaboliques. Ainsi, la 
classification enoncee ci-dessus ne doit pas etre consideree comme limitative, un gene 
pouvant etre implique dans deux voies metaboliques distinctes. 

25 La prtsente invention a egalement pour objet les sequences nucleotidiques et/ou 

de polypeptides selon l'invention, caracterisees en ce que lesdites sequences sont 
enregistrees sur un support d'enregistrement dont la forme et la nature facilitent la 
lecture, P analyse et/ou Pexploitation de ladite ou desdites sequence(s). Ces supports 
peuvent egalement contenir d'autres informations extraites de la presente invention, 

30 notamment les analogies avec des sequences deja connues, et/ou des informations 
concernant les sequences nucleotidiques et/ou de polypeptides d'autres micro- 
organismes afin de faciliter Panalyse comparative et Pexploitation des resultats obtenus. 

Parmi cesdits supports d'enregistrement, on prefere en particulier les supports 
lisibles par un ordinateur, tels les supports magnetiques, optiques, electriques ou 
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hybrides, en particulier les disquettes informatiques, les CD-ROM, les serveurs 
informatiques. De tels supports d'enregistrement sont egalement objet de Pinvention. 

Les supports d'enregistrement selon Pinvention, avec les informations 
apportees, sont tres utiles pour Ie choix <P amorces ou de sondes nucleotidiques pour la 
5 determination de genes dans Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou 
souches proches de cet organisme. De meme, Putilisation de ces supports pour Petude 
du polymorphisme genetique de souches proches de Streptococcus agalactiae CIP 
82.45 (ATCC 12403), en particulier par la determination des regions de colinearite, est 
tres utile dans la mesure ou ces supports fournissent non seulement la sequence 
10 nuclcotidiquc du genome de Streptococcus agalactiae CIP 82.45 (ATCC 12403), mais 
egalement Porganisation genomique dans ladite sequence. Ainsi, les utilisations de 
supports d'enregistrement selon Pinvention sont egalement des objets de Pinvention. 

Lanalyse d'homologie entre differentes sequences s'effectue en effet 
avaniageusement a Paide de logiciels de comparaison de sequences, tels le logiciel 
1 5 Blast, ou les logiciels de la trousse GCG, decrits precedemment. 

1/ invention vise egalement les vecteurs de clonage et/ou d'expression, qui 
contiennent une sequence nucleotidique selon Pinvention. 

Les vecteurs selon Pinvention component de preference des elements qui 
pcrmettent Pexpression et/ou la secretion des sequences nucleotidiques dans une cellule 
20 hote determines 

Le vecteur doit alors comporter un promoteur, des signaux d' initiation et de 
terminaison de la traduction, ainsi que des regions appropriees de regulation de la 
transcription. II doit pouvoir etre maintenu de fafon stable dans la cellule hote et peut 
eventuellement posseder des signaux particuliers qui specifient la secretion de la 
25 proteine traduite. Ces differents elements sont choisis et optimises par Phomme du 
metier en fonction de Phdte cellulaire utilise. A cet effet, les sequences nucleotidiques 
selon Pinvention peuvent etre inserees dans des vecteurs a replication autonome au sein 
de Phdte choisi, ou etre des vecteurs integratifs de Phote choisi. 

De tels vecteurs sont prepares par des methodes couramment utilisees par 
30 I'homme du metier, et les clones resultant peuvent etre introduits dans un hote approprie 
par des methodes standards, telles que la lipofection, Pelectroporation, le choc 
therm ique, ou des methodes chimiques. 
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Les vecteurs selon Finvention sont par exemple des vecteurs d'origine 
plasmidique ou virale. lis sont utiles pour transformer des cellules hotes afin de doner 
ou d'exprimer les sequences nucleotidiques selon Finvention. 

L' invention comprend egalement les cellules hotes transformees par un vecteur 
5 selon Finvention. 

L'hote cellulaire peut etre choisi parmi des systemes procaryotes ou eucaryotes, 
par exemple les cellules bacteriennes mais egalement les cellules de levure ou les 
cellules animates, en particulier les cellules de mammiferes. On peut egalement utiliser 
des cellules d'insectes ou des cellules de plantes. Les cellules hotes preferees selon 
10 T invention sont en particulier les cellules procaryotes, de preference les bacteries 
appartenant au genre Streptococcus, a Fespece Streptococcus agalactiae, plus 
particulierement Streptococcus agalactiae CIP 82.45 (ATCC 12403), ou les micro- 
organismes associes a Fespece Streptococcus agalactiae, 

L'invention concerne egalement les vegetaux et les animaux, excepte Fhomme, 
15 qui comprennent une cellule transformee selon Finvention. Les cellules transformees 
selon Finvention sont utilisables dans des precedes de preparation de polypeptides 
recombinants selon Finvention. Les procedes de preparation d'un polypeptide selon 
Finvention sous forme recombinante, caracterises en ce qu'ils mettent en oeuvre un 
vecteur et/ou une cellule transformee par un vecteur selon Finvention sont eux-memes 
20 compris dans la presente invention. De preference, on cultive une cellule transformee 
par un vecteur selon Finvention dans des conditions qui permettent Fexpression dudit 
polypeptide et on recupere ledit peptide recombinant. 

Ainsi qu'il a ete dit, Fhdte cellulaire peut etre choisi parmi des systemes 
procaryotes ou eucaryotes. En particulier, il est possible d' identifier des sequences 
25 nucleotidiques selon Finvention, facilitant la secretion dans un tel systeme procaryote 
ou eucaryote. Un vecteur selon Finvention portant une telle sequence peut done etre 
avantageusement utilise pour la production de proteines recombinantes, destinees a etre 
secretees. En effet, la purification de ces proteines recombinantes d'interet sera facilitee 
par le fait qu'elles sont presentent dans le surnageant de la culture cellulaire plutot qu'a 
30 l ' interieur des eel lules hotes. 

On peut egalement preparer les polypeptides selon Finvention par synthese 
chimique. Un tel procede de preparation est egalement un objet de Finvention. 
L'homme du metier connait les procedes de synthese chimique, par exemple les 
techniques mettant en oeuvre des phases solides (voir notamment Steward et ah, 1984, 
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Solid phase peptides synthesis, Pierce Chem. Company, Rockford, 111, 2eme ed., 
(1984)) ou des techniques utilisant des phases solides partielles, par condensation de 
fragments ou par une synthese en solution classique. Les polypeptides obtenus par 
synthese chimique et pouvant comporter des acides amines non naturels correspondants 
5 sont egalement compris dans l'invention. 

L' invention est en outre relative a des polypeptides hybrides presentant au moins 
un polypeptide ou un de ses fragments selon l'invention, et une sequence d'un 
polypeptide susceptible d'induire une reponse immunitaire chez 1'homme ou l'animal. 

Avantageusement, le determinant antigenique est tel qu'il est susceptible 
1 0 d'induire une reponse humorale et/ou cellulaire. 

Un tel determinant pourra comprendre un polypeptide ou un de ses fragments 
selon l'invention sous forme glycosylee, utilise en vue d'obtenir des compositions 
immunogenes susceptibles d'induire la synthese d'anticorps diriges contre des epitopes 
multiples. Lesdits polypeptides ou leurs fragments glycosyles font egalement partie de 
15 l'invention. 

Ces molecules hybrides peuvent etre constitutes en partie d'une molecule 
porteuse de polypeptides ou de leurs fragments selon l'invention, associee a une partie 
eventuellement immunogene, en particulier un epitope de la toxine diphterique, la 
toxine tetanique, un antigene de surface du virus de 1'hepatite B (brevet FR 79 2181 1), 
20 Pantigene VP1 du virus de la poliomyelite ou toute autre toxine ou antigene viral ou 
bacterien. 

Les precedes de synthese des molecules hybrides englobent les methodes 
utilisees en genie genetique pour construire des sequences micleotidiques hybrides 
codant pour les sequences polypeptidiques recherchees. On pourra, par exemple, se 
25 referer avantageusement a la technique d'obtention de genes codant pour des proteines 
de fusion decrite par Minton en 1984. 

Lesdites sequences micleotidiques hybrides codant pour un polypeptide hybride 
ainsi que les polypeptides hybrides selon l'invention, caracterises en ce qu'il s'agit de 
polypeptides recombinants obtenus par l'expression desdites sequences nucleotidiques 
30 hybrides, font egalement partie de l'invention. 

L'invention comprend egalement les vecteurs caracterises en ce qu'ils 
contiennent une desdites sequences nucleotidiques hybrides. Les cellules hotes 
transformees par lesdits vecteurs, les animaux transgeniques comprenant une desdites 
cellules transformees ainsi que les procedes de preparation de polypeptides 
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recombinants utilisant lesdits veoteurs, lesdites cellules transformees et/ou lesdits 
animaux transgeniques font egalement partie de P invention. 

Le couplage entre un polypeptide selon Pinvention et un polypeptide 
immunogene peut etre effectue par voie chimique, ou par voie biologique. Ainsi, selon 
5 Pinvention, il est possible d'introduire un ou plusieurs element(s) de liaison, notamment 
des acides amines pour faciliter les reactions de couplage entre le polypeptide selon 
Pinvention, et le polypeptide immunostimulateur, le couplage covalent de Pantigene 
immunostimulateur pouvant etre realise a Pextremite N ou C-terminale du polypeptide 
selon Pinvention. Les reactifs bifonctionnels permettant ce couplage sont determines en 

10 fonction de Pextremite choisie pour realiser ce couplage, et les techniques de couplage 
sont bien connues de Phomme du metier. 

Les conjugues issus d'un couplage de peptides peuvent etre egalement prepares 
par recombinaison genetique. Le peptide hybride (conjugue) peut en effet etre produit 
par des techniques d'ADN recombinant, par insertion ou addition a la sequence d' ADN 

15 codant pour le polypeptide selon Pinvention, d'une sequence codant pour le ou les 
peptide(s) antigene(s), immunogene(s) ou haptene(s). Ces techniques de preparation de 
peptides hybrides par recombinaison genetique sont bien connues de Phomme du metier 
(voir par exemple Makrides, 1996, Microbiological Reviews (JO, 5 12-538). 

De preference, ledit polypeptide immunitaire est choisi dans le groupe des 

20 peptides contenant les anatoxines, notamment le toxoide diphterique ou le toxoide 
tetanique, les proteines derivees du Streptocoque (comme la proteine de liaison a la 
seralbumine humaine), les proteines membranaires OMPA et les complexes de 
proteines de membranes extemes, les vesicules de membranes externes ou les proteines 
de chocs thermiques. 

25 Les polypeptides hybrides selon Pinvention sont tres utiles pour obtenir des 

anticorps monoclonaux ou polyclonaux, capables de reconnaitre specifiquement les 
polypeptides selon Pinvention. En effet, un polypeptide hybride selon Pinvention 
penriet la potentialisation de la r^ponse immunitaire, contre le polypeptide selon 
Pinvention couple a la molecule immunogene. De tels anticorps monoclonaux ou 

30 polyclonaux, leurs fragments, ou les anticorps chimeriques, reconnaissant les 
polypeptides selon Pinvention, sont egalement objet de Pinvention. 

Les anticorps monoclonaux specifiques peuvent etre obtenus selon la methode 
classique de culture d'hybridome decrite par Kohler et Milstein (1975, Nature 256, 
495). 
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Les anticorps selon l'invention sont par exemple des anticbrps chimeriques, des 
anticorps humanises, des fragments Fab, ou F(ab') 2 . lis peuvent egalement se presenter 
sous forme d'immunoconjugues ou d'anticorps marques afin d'obtenir un signal 
detectable et/ou quantifiable. 
5 Ainsi, les anticorps selon V invention peuvent etre employes dans un procede 

pour la detection et/ou 1' identification de bacteries appartenant a 1'espece Streptococcus 
agalactiae ou a un micro-organisme associe dans un echantillon biologique, caracterise 
en ce qu'il comprend les etapes suivantes: 

a) mise en contact de l'echantillon biologique avec un anticorps selon l'invention ; 

10 b) mise en evidence du complexe antigene-anticorps eventuellement forme. 

Les anticorps selon la presente invention sont egalement utilisables afin de 
detecter une expression d'un gene de Streptococcus agalactiae ou de micro-organismes 
associes. En effet, la presence du produit d'expression d'un gene reconnu par un 
anticorps specifique dudit produit d'expression peut etre detectee par la presence d'un 

15 complexe antigene-anticorps forme apres la mise en contact de la souche de 
Streptococcus agalactiae ou du micro-organisme associe avec un anticorps selon 
l'invention. La souche bacterienne utilisee peut avoir ete « preparee », c'est-a-dire 
centrifugee, lysee, placee dans un reactif approprie pour la constitution du milieu 
propice a la reaction immunologique. En particulier, on prefere un procede de detection 

20 de l'expression dans le gene, correspondant a un Western blot, pouvant etre effectue 
apres une electrophorese sur gel de polyacrylamide d'un lysat de la souche bacterienne, 
en presence ou en 1'absence de conditions reductrices (SDS-PAGE). Apres migration et 
separation des proteines sur le gel de polyacrylamide, on transfere lesdites proteines sur 
une membrane appropriee (par exemple en nylon) et on detecte la presence de la 

25 proteine ou du polypeptide d'interet, par mise en contact de ladite membrane avec un 
anticorps selon l'invention. 

Ainsi, la presente invention comprend egalement les kits ou necessaires pour la 
mise en oeuvre d'un procede tel que decrit (de detection de l'expression d'un gene de 
Streptococcus agalactiae ou d'un micro-organisme associe, ou pour la detection et/ou 

30 P identification de bacteries appartenant a l'espece Streptococcus agalactiae ou un 
micro-organisme associe), comprenant les elements suivants : 

a) un anticorps polyclonal ou monoclonal selon l'invention ; 

b) eventuellement, les reactifs pour la constitution du milieu propice a la reaction 
immunologique ; 
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c) eventuellement, les reactifs permettant la mise en evidence des complexes antigene- 
anticorps produits par la reaction immunologique. 

Les polypeptides et les anticorps selon l'invention peuvent avantageusement etre 
immobilises sur un support, notamment une puce a proteines. Une telle puce a proteines 
5 est un objet de l'invention, et peut egalement contenir au moins un polypeptide d'un 
micro-organisme autre que Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un 
anticorps dirige contre un compose d'un micro-organisme autre que Streptococcus 
agalactiae CIP 82.45 (ATCC 12403). 

Les puces a proteines ou filtres a haute densite contenant des proteines selon 
10 Pinvention peuvent etre construites de la meme maniere que les puces a ADN selon 
l'invention. En pratique, on peut effectuer la synthese des polypeptides directement 
fixes sur la puce a proteines, ou effectuer une synthese ex situ suivie d'une etape de 
fixation sur ladite puce du polypeptide synthetise. Cette derniere methode est preferable, 
lorsque 1'on desire fixer des proteines de taille importante sur le support, ces proteines 
15 etant avantageusement preparees par genie genetique. Toutefois, si Ton ne desire fixer 
que des peptides sur le support de ladite puce, il peut etre plus interessant de proceder a 
la synthese desdits peptides directement in situ. 

Les puces a proteines selon l'invention peuvent etre avantageusement utilisees 
dans des kits ou necessaires pour la detection et/ou P identification de bacteries 
20 associees a Pespece Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou a un micro- 
organisme, ou de fa9on plus generate dans des kits ou necessaires pour la detection 
et/ou P identification de micro-organismes. Lorsque Pon fixe les polypeptides selon 
Pinvention sur les puces a ADN, on recherche la presence d'anticorps dans les 
echantillons testes, la fixation d'un anticorps selon Pinvention sur le support de la puce 
25 a proteines permettant P identification de la proteine dont ledit anticorps est specifique. 

De preference, on fixe un anticorps selon Pinvention sur le support de la puce a 
proteines, et on d&ecte la presence de Pantigene correspondant, specifique de 
Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou d'un micro-organisme associe. 
Une puce a proteines ci-dessus decrite peut etre utilisee pour la detection de 
30 produits de genes, pour etablir un profil d'expression desdits genes, en complement 
d'une puce a ADN selon Pinvention. 

Les puces a proteines selon Pinvention sont egalement extremement utiles pour 
les experiences de proteomique, qui etudie les interactions entre les differentes proteines 
d'un micro-organisme donne. De fa<?on simplifiee, on fixe des peptides representatifs 
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des differentes proteines d'un organisme sur un support. Puis, on met ledit support en 
contact avec des proteines marquees, et apres une etape optionnelle de rin9age, on 
detecte des interactions entre lesdites proteines marquees et les peptides fixes sur la 
puce a proteines. 

5 Ainsi, les puces a proteines comprenant une sequence polypeptidique selon 

l'invention ou un anticorps selon l'invention sont objet de l'invention, ainsi que les kits 
ou necessaires les contenant. 

La presente invention couvre egalement un procede de detection et/ou _ 
d'identification de bacteries appartenant a Pespece Streptococcus agalactiae CIP 82.45 
10 (ATCC 12403) ou a un micro-organisme associe dans un echantillon biologique, qui 
met en oeuvre une sequence nucleotidique selon l'invention. 

U doit etre entendu que le terme dchantillon biologique concerne dans la 
presente invention les echantillons preleves a partir d'un organisme vivant (en 
particulier sang, tissus, organes ou autres preleves a partir d'un mammifere) ou un 
15 echantillon contenant du materiel biologique, c'est-a-dire de l'ADN ou de l'ARN. Un 
tel echantillon biologique comprend aussi les compositions alimentaires contenant des 
bacteries (par exemple les fromages, les produits laitiers), mais egalement des 
compositions alimentaires contenant des levures (bieres, pains) ou autres. Le terme 
echantillon biologique concerne aussi les bacteries isolees a partir de ces prelevements 
20 ou compositions alimentaires. 

Le procede de detection et/ou d'identification mettant en ceuvre les sequences 
nucleotidiques selon l'invention peut etre de diverse nature. 

On prefere un procede comportant les etapes suivantes : 

a) eventuellement, isolement de TADN a partir de Techantillon biologique a analyser, 
25 ou obtention d'un ADNc a partir de l'ARN de Pechantillon biologique ; 

b) amplification specifique de l'ADN de bacteries appartenant & Pesp£ce Streptococcus 
agalactiae CIP 82.45 (ATCC 12403) ou a un micro-organisme assocte a l'aide d'au 
moins une amorce selon l'invention ; 

c) mise en evidence des produits d'amplification. 

30 Ce procede est base sur ramplification specifique de l'ADN, en particulier par 

une reaction d'amplification en chaine. 

On prefere egalement un procede comprenant les etapes suivantes : 
a) mise en contact d'une sonde nucleotidique selon l'invention avec un echantillon 
biologique, l'acide nucleique contenu dans Pechantillon biologique ayant, le cas 
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echeant, prealablement ete rendu accessible a Phybridation, dans des conditions 
permettant Phybridation de la sonde a Pacide nucleique d'une bacterie appartenant a 
Pespece Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou a un micro- 
organisme associe ; 

5 b) mise en evidence de Phybride eventuellement forme entre la sonde nucleotidique et 
PADN de Pechantillon biologique. 

Un tel procede ne doit pas etre limite a la detection de la presence de l'ADN 
contenu dans Pechantillon biologique a tester, il peut etre egalement mis en oeuvre pour 
detecter PARN contenu dans ledit 6chantillon. Ce procede englobe en particulier les 
1 0 Southern et Northern blot. 

Un autre procede prefere selon Pinvention comprend les etapes suivantes : 

a) mise en contact d'une sonde nucleotidique immobilisee sur un support selon 
Pinvention avec un echantillon biologique, Pacide nucleique de Pechantillon, ayant, 
le cas echeant, ete prealablement rendu accessible a Phybridation, dans des 

15 conditions permettant Phybridation de la sonde a Pacide nucleique d'une bacterie 
appartenant a Pespece Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou a un 
micro-organisme associe ; 

b) mise en contact de Phybride forme entre la sonde nucleotidique immobilisee sur un 
support et Pacide nucleique contenu dans Pechantillon biologique, le cas echeant 

20 apres elimination de PADN de Pechantillon biologique n'ayant pas hybride avec la 
sonde, avec une sonde nucleotidique marquee selon Pinvention ; 

c) mise en evidence du nouvel hybride forme a Petape b). 

Ce procede est avantageusement utilise avec une puce a ADN selon Pinvention, 
Pacide nucleique recherche s'hybridant avec une sonde presente a la surface de ladite 
25 puce, et etant detecte par Putilisation d'une sonde marquee. Ce procede est 
avantageusement mis en ceuvre en combinant une etape prealable d'amplification de 
PADN ou de PADN complementaire obtenu eventuellement par transcription inverse, a 
Paide d'amorces selon Pinvention. 



30 detection et/ou P identification de bacteries appartenant a Pespece Streptococcus 
agalactiae CIP 82.45 (ATCC 12403) ou a un micro-organisme associe, caracterise en ce 
qu'il comprend les elements suivants : 
a) une sonde nucleotidique selon Pinvention ; 



Ainsi, la presente invention englobe egalement les kits ou necessaires pour la 
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b) eventuellement, les reactifs necessaires a la mise en oeuvre d'une reaction 
d' hybridation ; 

c) eventuellement, au moins une amorce selon Finvention ainsi que les reactifs 
necessaires a une reaction d'amplification de l'ADN. 

5 De meme, la presente invention englobe egalement les kits ou necessaires pour 

la detection et/ou F identification de bacteries appartenant a Fespece Streptococcus 
agalactiae CIP 82.45 (ATCC 12403) ou a un micro-organisme associe, caracterise en ce 
qu'il comprend les elements suivants : 

a) une sonde nucleotidique, dite sonde de capture, selon Finvention ; 
10 b) une sonde oligonucleotidique, dite sonde de revelation, selon Finvention ; 

c) eventuellement, au moins une amorce selon Finvention ainsi que les reactifs 
necessaires a une reaction d'amplification de F ADN. 

Enfin, les kits ou necessaires pour la detection et/ou F identification de bacteries 
appartenant a Fespece Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou a un 
1 5 micro-organisme associe, caracterise en ce qu'il comprend les elements suivants : 

a) au moins une amorce selon Finvention ; 

b) eventuellement, les reactifs necessaires pour effectuer une reaction d'amplification 
d'ADN ; 

c) eventuellement, un composant permettant de verifier la sequence du fragment 
20 amplifie, plus particulierement une sonde oligonucleotidique selon Finvention, 

sont Egalement objet de la presente invention. 

De preference, lesdites amorces et/ou sondes et/ou polypeptides et/ou anticorps 
selon la presente invention utilises dans les procedes et/ou kits ou necessaires selon la 
presente invention sont choisis parmi les amorces et/ou sondes et/ou polypeptides et/ou 
25 anticorps specifiques de Fespece Streptococcus agalactiae CIP 82.45 (ATCC 12403). 
De maniere preferee, ces elements sont choisis pami les sequences nucleotidiques 
codant pour une proline secretee, parmi les polypeptides secretes, ou parmi les 
anticorps diriges contre des polypeptides secretes de Streptococcus agalactiae CIP 
82.45 (ATCC 12403). 

30 La presente invention a egalement pour objet les souches de Streptococcus 

agalactiae CIP 82.45 (ATCC 12403) et/ou de micro-organismes associes contenant une 
ou plusieurs mutation(s) dans une sequence nucleotidique selon Finvention, en 
particulier une sequence ORF, ou leurs elements regulateurs (en particulier promoteurs). 
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On prefere, selon la presente invention, les souches de Streptococcus agalactiae 
CIP 82.45 (ATCC 12403) presentant une ou plusieurs mutation(s) dans les sequences 
nucleotidiques codant pour des polypeptides impliques dans la machinerie cellulaire, en 
particulier la secretion, le metabolisme intermediaire central, le metabolisme 
5 energetique, les processus de synthese des acides amines, de transcription et de 
traduction, de synthese des polypeptides. 

Lesdites mutations peuvent mener a une inactivation du gene, ou en particulier 
lorsqu'elles sont situees dans les elements regulateurs dudit gene, a une subexpression 
de cclui-ci. 

10 1/ invention conceme en outre Putilisation d'une sequence nucleotidique selon 

Pinvention. d un polypeptide selon Pinvention, d'un anticorps selon Pinvention, d'une 
cellule selon Pinvention, et/ou d'un animal transforme selon l'invention, pour la 
selection de compose organique ou inorganique capable de moduler, de reguler, 
d'induire ou d'inhiber l'expression de genes, et/ou de modifier la replication cellulaire 

15 de cellules eucaryotes ou procaryotes ou capables d'induire, d'inhiber ou d'aggraver 
une pathologies liees a une infection par Streptococcus agalactiae ou un de ses micro- 
organismcs associes. 

L'invention comprend egalement une methode de selection de composes 
capables de se lier a un polypeptide ou un de ses fragments selon Pinvention, capables 

20 de se licr a une sequence nucleotidique selon l'invention, ou capables de reconnaitre un 
anticorps selon l'invention, et/ou capables de moduler, de reguler, d'induire ou d'inhiber 
Pexpression de genes, et/ou de modifier la croissance ou la replication cellulaire de 
cellules eucaryotes ou procaryotes, ou capables d'induire, d'inhiber ou d'aggraver chez 
un organisme animal ou humain une pathologie liee a une infection par Streptococcus , 

25 par cxcmple par Streptococcus agalactiae, ou un de ses micro-organismes associes, 
caracterisee en ce qu'elle comprend les etapes suivantes : 

a) mise en contact dudit compose avec ledit polypeptide, ladite sequence nucleotidique, 
avec une cellule transformee selon Pinvention et/ou administration dudit compose a 
un animal transforme selon Pinvention ; 
30 b) determination de la capacite dudit compose a se lier avec ledit polypeptide ou ladite 
sequence nucleotidique, ou de moduler, de reguler, d'induire ou d'inhiber 
Pexpression de genes, ou de moduler la croissance ou la replication cellulaire, ou 
d'induire, d'inhiber ou d'aggraver chez ledit animal transforme les pathologies liees 
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a une infection par Streptococcus, par exemple Streptococcus agalactiae ou un de ses 
micro-organismes associes. 

Les cellules et/ou les animaux transformes selon Pinvention, pourront 
avantageusement servir de modele et etre utilises dans des precedes pour etudier, 
5 identifier et/ou selectionner des composes susceptibles d'etre responsables de 
pathologies induites ou aggravees par Streptococcus agalactiae, ou susceptibles de 
prevenir et/ou de traiter ces pathologies. En particulier, les cellules hotes transformees, 
notamment les bacteries de la famille des Streptococcus dont la transformation par un 
vecteur selon Pinvention peut par exemple accroitre ou inhiber son pouvoir infectieux, 
10 ou moduler les pathologies habituellement induites ou aggravees par Pinfection, 
pourront etre utilisees pour infecter des animaux dont on suivra Papparition des 
pathologies. Ces animaux non transformes, infectes par exemple avec des bacteries 
Streptococcus transformees, pourront servir de modele d'etude. De la meme maniere, 
les animaux transformes selon Pinvention pourront etre utilises dans des procedes de 
15 selection de composes susceptibles de prevenir et/ou de traiter les maladies dues a 
Streptococcus. Lesdits procedes utilisant lesdites cellules transformees et/ou animaux 
transformes, font partie de 1 ' invention. 

Les composes susceptibles d'etre selectionnSs peuvent etre des composes 
organiques tels que des polypeptides ou hydrates de carbone ou tous autres composes 
20 organiques ou inorganiques d£ja connus, ou des composes organiques nouveaux 
elabor^s a partir de techniques de modelisation moleculaire et obtenus par synthese 
chimique ou biochimique, ces techniques etant connues de l'homme de Tart. 

Lesdits composes selectionnes pourront etre utilises pour moduler la croissance 
et/ou la replication cellulaire de Streptococcus agalactiae ou tout autre micro-organisme 
25 associe et ainsi pour controler Pinfection par ces micro-organismes. Lesdits composes 
selon Pinvention pourront egalement etre utilises pour moduler la croissance et/ou la 
replication cellulaire de toutes cellules eucaryotes ou procaryotes, notamment les 
cellules tumorales et les micro-organismes infectieux, pour lesquelles lesdits composes 
s'avereront actifs, les methodes permettant de determiner lesdites modulations etant 
30 bien connues de Phomme de Part. 

On entend designer par compose capable de moduler la croissance d'un micro- 
organisme tout compose permettant d'intervenir, de modifier, de limiter et/ou de reduire 
le developpement, la croissance, la vitesse de proliferation et/ou la viabilite dudit micro- 
organisme. 
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Cette modulation peut etre realisee par exemple par un agent capable de se lier a 
une proteine et ainsi d'inhiber ou de potentialiser son activite biologique, ou capable de 
se lier a une proteine membranaire de la surface exterieure d'un micro-organisme et de 
bloquer la penetration dudit micro-organisme dans la cellule hote ou de favoriser 
5 Taction du systeme immunitaire de Torganisme infecte dirige a rencontre dudit micro- 
organisme. Cette modulation peut etre egalement realisee par un agent capable de se lier 
a une sequence nucleotidique d'un ADN ou ARN d'un micro-organisme et de bloquer 
par exemple l'expression d'un polypeptide dont Pactivite biologique ou structurelle est 
necessaire a la croissance ou a la reproduction dudit micro-organisme. 

10 On entend designer par micro-organisme associe dans la presente invention, tout 

micro-organisme dont l'expression de gene peut etre modulee, regulee, induite ou 
inhibee, ou dont la croissance ou la replication cellulaire peut etre egalement modulee 
par un compose de 1'invention. On entend designer egalement par micro-organisme 
associe dans la presente invention, tout micro-organisme comportant des sequences 

15 nucleotidiques ou des polypeptides selon Pinvention. Ces micro-organismes peuvent 
dans certains cas comporter des polypeptides ou des sequences nucleotidiques 
identiques ou homologues a celles de Pinvention et pourront egalement etre detectes 
et/ou identifies par les precedes ou kit de detection et/ou d' identification selon 
Pinvention et egalement servir de cible pour les composes de invention. On entend 

20 aussi designer par micro-organisme tout micro-organisme Streptococcus agalactiae de 
tout serotype. 

L'invention concerne les composes susceptibles d'etre selectionnes par une 
methode de selection selon Pinvention. 

L'invention concerne egalement une composition pharmaceutique comprenant 
25 un compose choisi parmi les composes suivants : 

a) une sequence nucleotidique selon Pinvention ; 

b) un polypeptide selon Pinvention ; 

c) un vecteur selon Pinvention ; 

d) un anticorps selon Pinvention ; et 

30 e) un compose susceptible d'etre selectionne par une methode de selection selon 
Pinvention, 

eventuellement en association avec un vehicule pharmaceutiquement acceptable. 
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La presente invention conceme en outre une composition phannaceutique selon 
Tinvention pour la prevention et le traitement (Tune infection par une bacterie 
appartenant a Tespece Streptococcus agalactiae. 

La presente invention conceme en outre une composition phannaceutique selon 
5 Tinvention, caracterisee en ce qu'elle comprend des anticorps diriges contre les 
polypeptides specifiques de Streptococcus agalactiae. 

On entend designer par quantite efficace, une quantite suffisante dudit compose 
ou anticorps. ou de polypeptide de Tinvention, permettant de moduler la croissance de 
Streptococcus agalactiae ou d'un micro-organisme associe. 
10 1/ invention concerne aussi une composition phannaceutique selon Tinvention 

pour la prevention ou le traitement d'une infection par une bacterie appartenant au genre 
Streptococcus ou par un micro-organisme associe. 

1/ invention vise en outre une composition immunogene et/ou vaccinale, 
caracterisee en cc qu'elle comprend un ou plusieurs polypeptides selon Tinvention et/ou 
15 un ou plusieurs polypeptides hybrides selon Tinvention. 

L'invention comprend aussi Tutilisation d'une cellule transformee selon 
Tinvention, pour la preparation d'une composition vaccinale. 

L'invention vise egalement une composition vaccinale, caracterisee en ce qu'elle 
conticnt une sequence nucleotidique selon Tinvention, un vecteur selon Tinvention 
20 et/ou unc cellule transformee selon Tinvention. 

L'invention concerne en outre une composition immunogene capable d'induire 
une reponse immunitaire cellulaire ou humorale pour la prevention ou le traitement 
d'une infection par une bacterie appartenant a I'espece Streptococcus agalactiae, 
caracterisee en ce qu'elle comprend une composition immunogene ou une composition 
25 vaccinale selon Tinvention, en association avec un vehicule pharmaceutiquement 
acceptable et eventuellement un ou plusieurs adjuvants de Timmunite appropries. 

L'invention concerne dgalement les compositions vaccinales selon Tinvention, 
pour la prevention ou le traitement d'une infection par une bact6rie appartenant au genre 
Streptococcus ou par un micro-organisme associe. 
30 De maniere preferee, les compositions immunogenes et/ou vaccinales selon 

Tinvention destinees a la prevention et/ou au traitement d'infection par Streptococcus ou 
par un micro-organisme associe seront choisies parmi les compositions immunogenes 
et/ou vaccinales comprenant un polypeptide ou un de ses fragments conespondant a une 
proteine, ou un de ses fragments, de Tenveloppe cellulaire de Streptococcus. Les 
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compositions vaccinales comprenant des sequences nucleotidiques comprendront de 
preference egalement des sequences nucleotidiques codant pour un polypeptide ou un 
de ses fragments correspondant a une proteine, ou un de ses fragments, de Penveloppe 
cellulaire de Streptococcus. 
5 Les polypeptides de 1'invention ou leurs fragments entrant dans les compositions 

immunogenes selon 1'invention peuvent etre selectionnes par des techniques connues de 
l'homme de Tart comme par exemple sur la capacite desdits polypeptides a stimuler les 
cellules T, qui se traduit par exemple par leur proliferation ou la secretion 
d'interleukines, ou qui aboutit a la. production d'anticorps diriges contre lesdits 
10 polypeptides. 

Chez la souris, chez laquelle une dose ponderale de la composition vaccinale 
comparable a la dose utilisee chez l'homme est administree, la reaction anticorps est 
testee par prelevement du serum suivi d'une etude de la formation d'un complexe entre 
les anticorps presents dans le serum et l'antigene de la composition vaccinale, selon les 

1 5 techniques usuelles. 

Selon 1'invention, lesdites compositions vaccinales seront de preference en 
association avec un vehicule pharmaceutiquement acceptable et, le cas echeant, avec un 
ou plusieurs adjuvants de Pimmunite appropries. 

Aujourd'hui, divers types de vaccins sont disponibles pour proteger l'homme 

20 contre des maladies infectieuses : micro-organismes vivants attenues (M bovis - BCG 
pour la tuberculose), micro-organismes inactives (virus de la grippe), des extraits 
acellulaires (Bordetella pertussis pour la coqueluche), proteines recombindes (antigene 
de surface du virus de l'hepatite B), des polyosides (pneumocoques). Des vaccins 
prepares a partir de peptides de synthese ou de micro-organismes genetiquement 

25 modifies exprimant des antigenes heterologues sont en cours d'experimentation. Plus 
recemment encore, des ADNs plasmidiques recombines portant des genes codant pour 
des antigenes protecteurs ont 6t6 proposes comme strategic vaccinale alternative. Ce 
type de vaccination est realise avec un plasmide particulier derivant d'un plasmide de 
E. coli qui ne se replique pas in vivo et qui code uniquement pour la proteine vaccinante. 

30 Des animaux ont ete immunises en injectant simplement TADN plasmidique nu dans le 
muscle. Cette technique conduit a l'expression de la proteine vaccinale in situ et a une 
reponse immunitaire de type cellulaire (CTL) et de type humoral (anticorps). Cette 
double induction de la reponse immunitaire est l'un des principaux avantages de la 
technique de vaccination avec de 1'ADN nu. 
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Les compositions vaccinales comprenant des sequences nucleotidiques ou des 
vecteurs dans lesquels sont inserees lesdites sequences, sont notanunent decrites dans la 
demande internationale N° WO 90/11092 et egalement dans la demande internationale 
N° WO 95/11307. 

5 La sequence nucleotidique constitutive de la composition vaccinale selon 

Tinvention peut etre injectee a l'hote apres avoir ete couplee a des composes qui 
favorisent la penetration de ce polynucleotide a Pinterieur de la cellule ou son transport 
jusqu'au noyau cellulaire. Les conjugues resultants peuvent etre encapsules dans des 
microparticules polymeres, comme decrit dans la demande internationale N° WO 

1 0 94/27238 (Medisorb Technologies International). 

Selon un autre mode de realisation de la composition vaccinale selon 
Tinvention, la sequence nucleotidique, de preference un ADN, est complexee avec du 
DEAE-dextran, avec des proteines nucleaires, avec des lipides ou encapsulee dans des 
liposomes ou encore introduite sous la forme d'un gel facilitant sa transfection dans les 

15 cellules. Le polynucleotide ou le vecteur selon Tinvention peut aussi etre en suspension 
dans une solution tampon ou etre associe a des liposomes. 

Avantageusement, un tel vaccin sera prepare conformement k la technique 
decrite par Tacson et al. ou Huygen et al. en 1996 ou encore conformement a la 
technique decrite par Davis et al. dans la demande internationale N° WO 95/1 1307. 

20 Un tel vaccin peut etre egalement prepare sous la forme d'une composition 

contenant un vecteur selon Tinvention, plac^e sous le controle d'etements de regulation 
permettant son expression chez Thomme ou Tanimal. On pourra par exemple utiliser, en 
tant que vecteur d'expression in vivo de Tantigene polypeptidique d'interet, le plasmide 
pcDNA3 ou le plasmide pcDNAl/neo, tous les deux commercialisms par Invitrogen (R 

25 & D Systems, Abingdon, Royaume-Uni). Un tel vaccin comprendra avantageusement, 
outre le vecteur recombinant, une solution saline, par exemple une solution de chlorure 
de sodium. 

On entend designer par vdhicule pharmaceutiquement acceptable, un compose 
ou une combinaison de composes entrant dans une composition pharmaceutique ou 
30 vaccinale ne provoquant pas de reactions secondaires et qui permet par exemple la 
facilitation de Tadministration du compose actif, Taugmentation de sa duree de vie et/ou 
de son efficacite dans Torganisme, Taugmentation de sa solubilite en solution ou encore 
Tamelioration de sa conservation. Ces vehicules pharmaceutiquement acceptables sont 
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bien connus et seront adaptes par Thonune de l'art en fonction de la nature et du mode 
d'administration du compose actif choisi. 

En ce qui concerne les formulations vaccinales, celles-ci peuvent comprendre 
des adjuvants de l'immunite appropries qui sont connus de l'homme de Tart, comme par 
5 exemple I'hydroxyde d'aluminium, un representant de la famille des muramyl peptides 
comme un des derives peptidiques du N-acetyl-muramyl, un lysat bacterien, ou encore 
Padjuvant incomplet de Freund. 

De preference, ces composes seront administres par voie systemique, en 
particulier par voie intraveineuse, par voie intramusculaire, intradermique ou sous- 
10 cutanee, ou par voie orale. De maniere plus preferee, la composition vaccinale 
comprenant des polypeptides selon l'invention, sera administree a plusieurs reprises, de 
maniere etalee dans le temps, par voie intradermique ou sous-cutanee. 

Leurs modes d'administration, posologies et formes galeniques optimaux 
peuvent etre determines selon les criteres generalement pris en compte dans 
15 l'etablissement d'un traitement adapte a un patient comme par exemple l'age ou le 
poids corporel du patient, la gravite de son etat general, la tolerance au traitement et les 
effets secondaires constates. 

Enfin, l'invention comprend l'utilisation d'une composition selon l'invention, 
pour le traitement ou la prevention de maladies induites ou aggravees par la presence de 
20 Streptococcus. 

Par ailleurs, la presente invention a egalement pour objet une banque d'ADN 
genomique d'une bacterie du genre Streptococcus, de maniere preferee, Streptococcus 
agalactiae, de maniere preferee la CIP 82.45 (ATCC 12403). 

La banque d'ADN genomique decrite dans la presente invention, en particulier 
25 la banque deposee a la CNCM le 28 decembre 2000 sous le numero d'ordre N° 1-2610, 
recouvre en effet Streptococcus agalactiae CIP 82.45 (ATCC 12403). Toutefois, si 
certaines regions n'ont pas pu etre clonees dans ladite banque, en raison de problemes 
de letalites chez Escherichia coli, ces regions peuvent facilement etre amplifiees et 
identifies par l'homme du metier, en utilisant des oligonucleotides specifiques des 
30 sequences des extremites des differents clones qui forment les contigs. 

La presente invention concerne egalement les methodes pour l'isolement d'un 
polynucleotide d'interet present chez une souche de Streptococcus agalactiae et absente 
chez une autre souche, qui utilise au moins une banque d'ADN basee par exemple sur 
un plasmide pSYX34 contenant un fragment du genome de Streptococcus agalactiae. 
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La methode selon Pinvention pour 1'isolement d'un polynucleotide d'interet peut 
comprendre les etapes suivantes : 

a) isoler au moins un polynucleotide contenu dans un clone de la banque d'ADN 
d'origine de Streptococcus agalactiae, 
5 b) isoler : 

- au moins un polynucleotide genomique ou ADNc d'une bacterie Streptococcus, 
ladite bacterie Streptococcus appartenant a une souche differente de la souche 
utilisee pour la construction de la banque d'ADN de l'etape a) ou, de fa?on 
alternative, 

10 - au moins un polynucleotide contenu dans un clone d'une banque d'ADN prepare a 
partir du genome d'une Streptococcus qui est differente de la souche Streptococcus 
agalactiae utilisee pour la construction de la banque d'ADN de l'etape a) ; 

c) hybrider le polynucleotide de l'etape a) au polynucleotide de l'etape b) ; 

d) selectionner les polynucleotides de l'etape a) qui n'ont pas forme de complexe 
1 5 d'hybridation avec les polynucleotides de l'etape b) ; 

e) caracteriser le polynucleotide selectionne. 

On peut preparer le polynucleotide de l'etape a) par la digestion d'au moins un 
clone recombinant avec une enzyme de restriction appropriee, et de fafon optionnelle, 
1'amplification de Pinsert polynucleotide qui en resulte. 
20 Ainsi, la methode de l'invention permet a 1'homme du metier d'effectuer des 

etudes genomiques comparatives entre les differentes souches ou especes du genre 
Streptococcus, par exemple entre les souches pathogeniques et leurs equivalents non 
pathogenes. 

En particulier, il est possible d'etudier et de determiner les regions de 
25 polymorphisme entre lesdites souches. 

L'invention comprend aussi un proced6 ^identification de sequence sp6cifique 
de Streptococcus agalactiae, caracterise par Talignement de sequences nucleotidiques 
de Streptococcus agalactiae selon Tinvention et le traitement de donnees obtenues par 
cet alignement pour isoler les sequences specifiques. 

30 

La presente invention concerne egalement Tutilisation des sequences nucleiques 
ou des polypeptides selon la presente invention : 

- pour la secretion de proteines, 

- comme facteurs de virulence, 
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- pour le contrdle par P intermediate du quorum-sensing, 

- pour P identification de cibles pour les maladies humaines dont Streptococcus 
agalactiae est un modele, et 

- pour 1' identification de cibles contre les bacteries Gram positives pathogenes 
5 par la methode de genomique soustractive (comme par exemple par comparaison avec 

des bacteries Gram positives non pathogenes). 



EXEMPLES 

Exemple 1 : Materiels et methode 

10 La strategic de sequen9age du genome de Streptococcus agalactiae CIP 82.45 

(ATCC 12403) repose sur un sequen9age alleatoire (shot-gun). La premiere etape de ce 
travail consiste a doner PADN genomique de la bacterie Streptococcus agalactiae dans 
differents vecteurs (plasmides et BAC). 
Materiels et methodes. 

15 1 . Construction des banques : 

a/ Banque de petits fragments dans le vecteur pcDNA2.1 

L'ADN chromosomique de la souche de Streptococcus agalactiae CIP 
82.45 (ATCC 12403) a ete prepare par une methode classique incluant un traitement a 
la proteinase K et une extraction au phenol (9). Environ 10 \ig d'ADN ont ete casses par 

20 nebulisation (1 minute sous une pression de 1 bar) (4). Les extremites des fragments 
d'ADN ont ete rendues franches en faisant agir la DNA-polymerase du bacteriophage 
T4 pendant 15 minutes a 37°C en presence des 4 nucleotides tri-phosphate. L'enzyme a 
ete inactivee par une incubation de 15 mn a 75°C. Des adaptateurs (invitrogen Cat. 
N° 408-18) ont ensuite ete ligatures a ces extremites. Apres ligature, les fragments 

25 d'ADN chromosomiques ayant une taille entre 1 000 et 3 000 paires de bases ont ete 
purifies apres electrophorese sur gel d'agarose. Le vecteur utilise pour la construction de 
la banque, pcDNA2.1 (Invitrogen), a ete digere par I'enzyme BstXl et purifie par 
geneclean (BIO- 101) apres electrophorese sur gel d'agarose. L'ADN chromosomique et 
le vecteur purifie ont ete ligatures par action de la ligase du bacteriophage T4, Le 

30 melange de ligation a ete introduit par transformation dans la souche & Escherichia coli 
XL2-blue (Stratagene). Environ 4000 colonies sont obtenues par ^1 du melange de 
ligation. 

b/ Construction d'une banque de fragments de taille moyenne (banque 
deposee a la CNCM sous le numero 1-2610) 
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Afin de limiter la frequence des evenements de co-ligation et de clones 
sans insert, la methode du remplissage partiel du site de coupure a ete utilisee (7). 

L'ADN chromosomique de la souche de Streptococcus agalactiae CIP 
82.45 (ATCC 12403) a ete digere de maniere partielie par l'enzyme de restriction 
5 Sau3A en utilisant une gamme de dilution de l'enzyme. La fraction presentant la gamme 
de tallies souhaitee (entre 2 et 12 kbases) a ete precipitee et les extremites ont ete 
remplies partiel lenient par le fragment de Klenow de la DNA polymerase d'£ coli en 
presence de dTTP et dCTP. Apres purification sur gel d'agarose les fragments d'ADN 
chromosomique ayant une taille comprise entre 3 et 6 kbases ont ete ligues au vecteur 

10 pSYX34 (7) digere par l'enzyme Sail remplie partiellement par l'enzyme de Klenow en 
presence de dATP et dGTP. Le melange de ligation a ete introduit par transformation 
dans la souche $ Escherichia coli XLlO-kan (Stratagene) et etalement sur milieu LB 
contenant du chloramphenicol a une concentration de 20 mg/l. Environ 500 colonies 
sont obtenues par nl du melange de ligation. 

15 2. Preparation des plasmides et sequen9age 

Les plasmides ont ete prepares par une methode semi-automatique de 
preparation developpde au laboratoire GMP base sur la methode de lyse alcaline (2). 
Les inserts chromosomiques ont ete sequences a partir de leurs deux extremites en 
utilisant les primer T7 et universel en suivant les recommandations du foumisseur (PE- 

20 biosystems). Les sequences ont ete determinees en utilisant un sequenceur automatique 
de type 3700 (PE-Biosystem). 

3. Assemblage des sequences 

Les sequences ont ete assemblies en utilisant 1'ensemble de logiciel 
developpe a l'Universite de Washington, Phred, Phrap et Consed (5, 8). La finition de la 

25 sequence a ete realisee en utilisant l'ensemble de logiciel GMPTB (7). L'etape de 
finition correspond au res£quen?age des regions oil la sequence est peu sure et le 
siquenfage des regions situees entre les contigs. Elle a et6 realisee en sequen?ant des 
produits de PCR correspondant a ces regions identifiees par un expert en utilisant les 
logiciels Consed (8) et GMPTB (7). Les sequences des oligonucleotides ont ete definies 

30 en utilisant les logiciels Consed et Primo (8, 10). 

4. Annotation des sequences 

L'identification des phases codantes (CDS) a ete realisee en utilisant 
Pensemble de logiciel GMPTB (L. Frangeul et al. non publie). Ce programme combine 
les resultats de differentes methodes : (i) Tidentification de phases ouvertes de lecture et 



^SDOCID; <WO_0209281 BA2_I_> 



WO 02/092818 





T/IB02/03059 



44 



ieur tri en fonction de leur taille, (ii) 1'analyse de la probability d'etre codante en utilisant 
le logiciel Genemark (11), (iii) Tidentification d'un debut de traduction (codon 
d'initiation et sequence de fixation du ribosome), (iv) similarite de la sequence proteique 
deduite avec les sequences proteiques contenues dans les banques de sequence en 
5 utilisant le logiciel BLASTP. 

Les fonctions des proteines codees par les phases codantes identifiees 
indiquees au tableau 1 ont ete predites par l'analyse des resultats de recherche de 
similarites dans les banques en utilisant le logiciel BLASTP (1). 
Exemple 2 : Description scientifique de la banque de BAC de Streptococcus agalactiae 
10 CIP 82.45 (ATCC 12403) deposee a la CNCM le 28 decembre 2000 sous le numero I- 
2610. 

Collection de clones & l Escherichia coli DH 10B™ (Calvin et al., J. Bacteriol. 
170, 2796, 1988) contenant des fragments d'ADN g^nomique de la bacterie 
Streptococcus agalactiae souche NEM 316,CIP 82.45 (ATCC 12403) , clones dans le 

1 5 vecteur pS YX34 (Xu et al, Biotechniques, 1 7:57, 1 990). Le vecteur a ete digere Sail et 
partiellement rempli a 1'aide de l'ADN polymerase afin de produire des extremites 
5'-TC. Des fragments genomiques aleatoires de 3-6 kb provenant de Streptococcus 
agalactiae (souche NEM 316, CIP 82-45, ATCC 12403) ont ete digeres partiellement 
par Sau3A et partiellement remplis afin de produire des extremites 5'-GA. Apres 

20 ligature in vitro et transformation, des clones resistant au chloramphenicol ont ete 
selectionnes. Environ 5000 clones ont ete assembles, suspendus dans 1 5 ml de milieu L 
et congeles. 

Exemple 3 : Les proteines de surface de Streptococcus agalactiae NEM3 16 



25 proteines dites du type LPXTG (Navarre et Schneewind, Microbial. Mol. Biol. Rev. 63 
174-229), jouent un role crucial lors du processus infectieux en permettant notamment 
des interactions entre le microorganisme et les cellules de l'hote et/ou Techappement au 
systeme immunitaire. Les inventeurs ont don focalise leur etude sur ce type de proteines 
qui presentent la particularity d'etre liees covalemment au peptidoglycane via le motif 

30 d'ancrage carboxylique LPXTG. Cette reaction est catalysee par une enzyme 
bifonctionnelle (endopeptidase-transpeptidase) appelee sortase. L'etude du role de ces 
proteines dans la virulence de S. agalactiae a ete realisee par 2 approches 



Les proteines de surface des bact^ries pathogenes, et plus particulierement les 
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complementaires (construction d'un mutant sortase-deficient, inactivation des genes 

codant pour des proteines de type LPXTG). 

- Le gene srtA de S. agalactiae NEM3 16 (IPF N°1268). 

Le mutant MEM 1979, depose le 24 avril 2002 a la CNCM sous le numero I- 
5 2861, est une souche mutante derivee de NEM316 (CIP 82.45, ATCC 12403) dans 
laquelle l'IPF 1 268 a ete inactive. 

L'analyse du genome de NEM316 nous a permis de caracteriser un gene srtA 
presentant homologie respectivement 55 % et 30 % d'identite avec les sortases de 
Streptococcus gordonii et de Staphylococcus aureus. Ce gene a ete inactive par 
10 insertion-inactivation et nous avons montre que le mutant ainsi construit n'adherait plus 
a des cellules epitheliales humaines pulmonaires (A549) et uterines (HeLa). Ces 
resultats suggerent que les proteines du type LPXTG de S. agalactiae jouent un role 
dans la virulence de cette bacterie, en permettant notamment son adhesion avec les 
cellules de Thote. 

1 5 - Recensement des proteines du type LPXTG de S. agalactiae NEM3 16. 

Une analyse in silico du genome de NEM316 a revele la presence de 30 
prolines de surface putatives possedant le motif d'ancrage de type LPXTG (Tableau 6). 
Nous avons etudie par amplification PCR, en utilisant des amorces specifiques, la 
distribution des genes codant pour 21 prolines du type LPXTG dans une collection de 

20 99 souches non-redondantes de S. agalactiae responsables d'infections non-invasives 
(70 souches provenant de portage ou d'infection urinaire) et invasives (29 souches 
provenant d'h6moculture ou de meningite). Cette etude a montrS que 6 de ces genes 
(IPN N° 1503, 678, 2192, 1861, 584, 280) etaient presents dans toutes les souches de 
notre echantillonnage (Tableau 7). Deux de ces six genes (IPF N°678 et 1503) ont ete 

25 inactives par insertion-inactivation et les mutants correspondants NEM2056 et 
NEM2057 presentaient une adherence diminuee avec les cellules Epitheliales A549 
(Tableau 5). 

Le mutant NEM2056, depose le 24 avril 2002 a la CNCM sous le numero I- 

2862, est une souche mutante derivee de NEM316 (CIP 82.45, ATCC 12403) dans 
30 laquelle 1 ' IPF 678 a ete inactive. 

Le mutant NEM2057, depose le 24 avril 2002 a la CNCM sous le numero I- 

2863, est une souche mutante derivee de NEM316 (CIP 82.45, ATCC 12403) dans 
laquelle 1'IPF 1503 a ete inactive. 
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- Cibles vaccinales. 

La presence des genes IPF N°1503, 678, 2192, 1861, 584, 280 chez toutes les 
souchcs de S. agalactiae testees font des proteines correspondantes des cibles vaccinales 
dc choix pour le developpement d'un vaccin anti-S. agalactiae. 

5 

TABLEAU 1 : Liste des phases codantes annotees identifiees par 1'analyse des 
sequences des contigs 

10 
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TABLEAU 2 . Proteines de surface de Streptococcus agalactiae 





SEQID 


N°IPF 


Motif 
LPXTG 


% id en tit e/ similitude 


1 


886 


18 


LPHTG 


24/37 : Sec (Surface exclusion proteinej E. faecalis 


2 


386 


1250 


LPSTG 


22/40 : Sec 10 (Surface exclusion proteine) 
Enterococcus faecalis plasmid pCFlO 


3 


1669 


280 


LPKTG 


50/65 : pullulanase S. pneumoniae 


4 


1895 


523 


LPATG 


90/91 : alpha like proteine S. agalactiae 


5 


806 


1716 


LPSTG 


31/46 : M-Iike proteine S. equi 


6 


1183 


2140 


LPLTG 


36/60 : cell-division protein homolog ywcF B. subtilis 
34/56 : stage V sporulation protein E B halodurans 


7 


1346 


2337 


LPKTG 


25/38 : Unknown B. halodurans 


S 


1942 


571 


LPSTG 


50/60 : Hemagglutinine S. gordonii 


9 


2129 


765 


LPNTG 


28/43 : sdrc & aureus 


10, 


2046 


678 


LPKTG 


57/70 : putative cyclo-nucleotide phosphodiesterase 
Strep, dysgalactiae susp. equismilis 


11 ! 


618 i 


1503 


LPKTG 


49/65 : celle envelope proteinase 5. thermophilus 


12 


1227 


220 


LPSTG 


30/43 : SspB (adhesion) S. gordonii 


13 i 


1954 : 


584 


LPKTG 


26/48 : hypothetical serine riche repeat prot ~S. pombe 


14 ; 


1493 . 


2495 


LPKTG 


23/47 : gene drosophile 


15 


1955 


585 


LPKTG 


30/46 : 6-aminohexanoate-cyclic-dimer hydrolase 
Deinococcus radiodurans . 


16 


943 


1861 


LPKTG 


50/62 : hypothetical protein 2 S. mutans 


17 


1221 


2192 


LPKTG 


35/48 : C elegans UNC-89 (6642 aa) 


18 


613 


15 


LPSTG 


37/52 : SpaA : Ag de surface de S. sobrinus 


19 


382 


1247 


LPSTG 


38/52 : SpaA : Ag de surface de S. sobrinus 


20 


792 ! 


17 


LPKTG 


30 /47 : hypothetical proteine iota de S. pyogenes 
plasmid pDB 101 


21 


383 


1248 


LPRTG 


38/52 : hypothetical proteine iota de S. pyogenes 
plasmid pDB 101 


22 


1418 


2414 


LPSTG 


33/47 : orfC E. faecalis, plasmid pAM-beta-1 


Autres proteines possibles (IPXTG, FPXTG) 


23 


2171 


807 


IPQTG 


31/43 : Inconnue B. Halodurans 
29/41 : fimbrial SU Actinomyces naeslundii 
24 :41 : putative cell-surface adhesin SdrF 
[Staphylococcus epidermidis] 


24' 


1343 


2334 


IPQTG 


27/38 : hypothetical protein 2 L leichmanii 
23/38 : fimbrial SU Actinomyces naeslundii 


25 


659 


1551 


FPKTG 


37/50 : fibronectin binding protein 1 £ pyogenes 
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n initiation protein DnaA | 


chromosome partitioning protein ParB I 


serine protease | 


unknown protein " | 


unknown transmembrane protein 


unknown proteins 


ABC transporter (ATP-binding protein) • — I 


unknown proteins | 


thiamine-phosphate pyrophosphorylase (ThiE) I 


UDP-N-acetylglucosamine 1 -carboxyvinyltransferase 


acetyl transferase 


unknown proteins | 


methionine aminopeptidase | 


unknown proteins j 


unknown proteins I 


unknown proteins | 


unknown proteins ! 


DNA ligase 


unknown proteins I 


pullulanase 


1 ,4-alpha-glucan branching enzyme j 


glucose-1 -phosphate adenylyltransferase 


glucose-1 -phosphate adenylyltransferase I 


glycogen synthase | 


recombination protein RecF j 


xanthine permease 


nitrite or formate transporter j 


unknown protein (N-terminal part) 


i, similar to unknown protein | 


other protein (putative thiamine biosynthesis I 




4-oxalocrotonate tautomerase 


kinase | 


hain release factor 1 j 


ransmembrane protein similar to unknown protein 


replicatioi 


similar to 


similar to 


similar to 


similar to 


similar to 


similar to 


similar to 


similar to 


Similar to 


Similar to 


Similar to 


similar to 


similar to 


similar to 


similar to 


similar to 


similar to 


similar to 


Similar to 


similar to 


similar to 


similar to 


simiiar to 


Similar to 


similar to 


similar to 


similar to 


Uniknowr 


similar to 


lipoproteii 


similar to 


thymidine 


peptide cl 


putative ti 
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similar to oxidoreductase 1 


similar to endopeptidase 


similar to unknown proteins i 


similar to L,D-carboxypeptidase LdcA j 


lysin rich protein 


similar to Na+/H+ antiporter 


similar to alkyl hydroperoxide reductase (large subunit) and 
I NADH dehydrogenase 


similar to alkyl hydroperoxide reductase (small subunit) 


similar to unknown proteins 


Unknown I 


similar to ornithine transcarbamylase 


Similar to unknown proteins I 


Similar to transcriptional regulator 


Similar to unknown proteins 


Similar to glycerol uptake facilitator 


Similar to unknown proteins 


Similar to unknown proteins 


Similar to hypothetical dihydroxyacetone kinase I 


Similar to putative transcription regulator 


Similar to putative dihydroxyacetone kinase j 


similar to arginine/ornithine antiporter I 


Similar to unknown proteins I 


Similar to other proteins 


similar to (amino acid'?) ABC transporter (binding protein) 


Similar to unknown protein I 


Similar to unknown proteins I 


similar to ABC transporter (ATP-binding protein) 


similar to ABC transporter (permease) 


similar to carbamate kinase 


similar to NAD alcohol dehydrogenase 


Similar to branched-chain amino acid transporter ! 


truncated C-terminal part 
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truncated C-terminal part 


truncated N-terminal part 
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Unknown ] 


similar to unknown proteins | 


Unknown | 


tryptophanyl-tRNA synthetase I 


similar to probable type II DNA modification enzyme 


similar to integrase 


similar to unknown proteins | 


similar to unknown proteins j 


similar to Phospho-beta-D-galactosidase 


Similar to lactose-specific PTS system enzyme HBC | 


Similar to lactose-specific PTS system enzyme IIA | 


Similar to transcription antiterminator I 


similar to tagatose-1 ,6-diphosphate aldolase I 


similar to tagatose 6-phosphate kinase | 


similar to galactose-6-phosphate isomerase (large subunit) | 


similar to galactose 6-P isomerase (small subunit) I 


Unknown | 


similar to unknown proteins | 


similar to unknown proteins | 


similar to unknown protein | 


Unknown | 


similar to plasmid recombination / mobilization protein 


Unknown | 


similar to plasmid replication protein | 


Unknown | 


similar to replication protein {N-termlnal part) | 


Unknown ! 


Unknown | 


similar to transcriptional regulator j 


similar to integrase I 


ribosomal protein S9 I 


50S ribosomal protein L13 | 


similar to unknown proteins | 


similar to N-acetylglucosamine metabolism protein | 


similar to other proteins | 


similar to coproporphyrinogen III oxidase (HemN) I 
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similar to unknown proteins i 


similar to unknown proteins 


similar to phospho-sugar mutase ( 


similar to unknown proteins 


similar to unknown proteins 


similar to unknown protein (to hypothetical UDP-N- 
acetylmuramyl tripeptide synthetase???) 


similar to other proteins 1 


similar to lipoate-protein ligase A 


50S ribosomal protein L17 


similar to acetoin dehydrogenase E3 component 
(dihydrolipoamide dehydrogenase) 


similar to acetoin dehydrogenase E2 component 
(dihydrolipoamide acetyltransferase) 


I similar to acetoin dehydrogenase (TPP-dependent) beta chain 


similar to acetoin dehydrogenase (TPP-dependent) alpha chain 


Similar to ABC transporter (ATP-binding protein) 


Unknown 


Unknown 


Unknown 


Unknown 
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Unknown 


Unknown 


putative peptidoglycan linked protein (LPXTG motif) 


putative peptidoglycan linked protein (LPXTG motif) I 


RNA polymerase (alpha subunit) 


similar to surface exclusion protein SedO precursor - 
Enterococcus faecalis piasmid pCF10 


Unknown 


Similar to phage protein 
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similar to putative piasmid replication initiator protein A 
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Unknown ] 


Similar to unknown protein | 
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similar to GMP reductase " '" | 
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similar to unknown protein j 


similar to unknown protein ■ •• | 


similar to sortase 


30S ribosomal protein S1 1 | 


DNA gyrase A subunit | 


similar to L-Lactate Dehydrogenase I 


similar to NADH Oxidase | 


similar to sugar (?) ABC transporter (permease) I 


simiiar to sugar (?) ABC transporter (permease) I 


similar to ABC transporter (ATP-binding protein) j 


ribosomal protein S13 | 


989056-990105 p similar to ABC transporter (binding protein) | 


similar to cytidine deaminase j 


similar to E. coii 16S RNA m2G1207 methyltransferase j 


similar to pantothenate kinase | 


30S ribosomal protein S20 | 


similar to amino acid ABC transporter (binding protein) I 


similar to amino acid ABC transporter (ATP-binding protein) | 


similar to unknown proteins 


similar to ABC transporter (permease) j 


Unknown | 


Similar to ABC transporter (permease) (N-terminal part) ! 


Similar to ABC transporter (permease) (C-terminal part) I 


Unknown | 


similar to glycosyltransferases j 


similar to acyl-carrier-protein synthase j 


similar to aminomethyltransferase | 


Unknown | 


similar to ABC transporter (permease) | 


Unknown | 


similar to ABC transporter (ATP-binding protein) 


1202249-1202692 m 


1202958-1203215 m 


1203399-1203770 m 


1203884-1204867 m | 


1001539-1002666 m 


1000513-1001475 p 


999946-1000359 p , 


999187-999930 p ! 


89069-89452 p 


996721-999180 p 


995493-996482 m I 


994003-995373 p 


992841-993797 p | 


991778-992839 p | 


990250-991785 p | 


88686-89051 p ] 


988602-988991 p | 


SA-1282.1 987686-988276 p | 


986660-987580 m I 


986358-986591 m | 


985443-986273 p ! 


984797-985426 p 


682243-683688 m 


681515-682186 p i 


681109-681303 p | 


680078-681100 p \ 


679319-680068 p | 


678697-679272 p I 


677517-678728 p | 


675317-677512 p J 


674367-675320 p | 


672367-674370 p ! 


671492-672370 p | 


1034915-1035172 m j 


670570-671499 p 


SA-1 256.1 | 


SA-1 257.1 ; 


SA-1 258.1 ! 


SA-1 261.1 ! 


396 i SA-1 265.2 : 


SA-1 266.1 


SA-1 267.1 


SA-1268.1 


SA-127.2 


SA-1271.1 


SA-1 273.1 


5 

CN 

1 

< 

CO 


SA-1 275.1 | 


SA-1 278.1 | 


SA-1 279.1 | 


SA-1 28.3 | 


408 SA-1 280.1 ! 


SA-1281. 1 ! 


SA-1283.1 | 


SA-1284.1 | 


SA-1 285.1 | 


SA-1 286.3 | 


SA-1288.3 1 


SA-1289. 1 j 


SA-1 290.1 | 


SA-1 291.1 | 


SA-1 292.1 ! 


SA-1 293.1 


SA-1 295.1 [ 


SA-1 296.1 | 


SA-1297.1 | 


SA-1 298.1 ! 


SA-1299.1 | 


SA-1 3.1 i 


SA-1 300.1 


2578 392 \ 


2579 ] 393 ! 


CD 
CO 


• 

m 
o> 

CO 

I 


I s - 
o 
co 


CO 

o> 

CO 


o> 

CD 
CO 


o 
o 


o 


CN 
O 


CO 
O 


N" 
O 


m 
o 


CD 
O 


h- 
o 

N" 


CD 
O 


o 




CM 


CO 




CO 


I s - 


CO 

T— 


CD 


o 

CM 


CN 


CM 
CM 


CO 
CM 


CM 


m 

CM 


CD 
CM 


h- 

CN 


CO 
CN 


2580 


2581 


2582 


2583 


2584 I 


2585 


2586 | 


2587 | 


2588 | 


2589 \ 


2590 | 


2591 | 


2592 | 


CO 
CD 

tn 

CN 

CD 
CM 
I s - 

0 

C 

Q 

O 
LU 

CO 


|SEQIDn°4730 2594 \ 


2595 f 


2596 I 


2597 | 


|SEQIDn°4734 I 2598 | 


2599 | 


2600 | 


2601 ' 


2602 ; 


2603 ! 


2604 | 


2605 i 


2606 | 


2607 | 


2608 


2609 | 


2610 I 


2611 | 


2612 | 


2613 


*t 

o 
C 

Q 

O 
UJ 

CO 


m 

r- 
I s - 

o 
C 

Q 

O 
LU 

CO 


CD 

I s - 

o 
C 

Q 

O 
UJ 

CO 


|SEQ ID n° 4717 


OO 

I s - 

o 
C 

O 

o 

UJ 

CO 


|SEQ IDn° 4719 


o 

CN 
I s - 

o 
C 

D 

O 
LU 
CO 


|SEQIDn°4721 


|SEQ ID n° 4722 


|SEQ ID n° 4723 


|SEQ ID n° 4724 


|SEQ ID n° 4725 


CO 
CN 

I s - 

o 
C 

Q 

a 

UJ 

CO 


I s - 

CN 
I s - 

o 

c 

a 
o 

UJ 

CO 


|SEQ ID n° 4728 j 


CO 

I s - 

o 
C 

Q 

O 
LU 

CO 


|SEQIDn°4732 | 


|SEQIDn°4733 | 


|SEQ ID n° 4735 \ 


|SEQIDn°4736 | 


|SEQ ID n° 4737 I 


00 
CO 

I s - 
^- 

o 

c 
Q 

O 
LU 

CO 


|SEQIDn°4739 ! 


o 
I s - 

o 

c 
Q 

a 

UJ 

CO 


|SEQIDn°4741 | 


CN 

I s - 

o 
C 

Q 

O 
LU 

CO 


CO 

I s - 

0 

C 

o 
a 

LU 

CO 


I s - 

o 

c 
Q 

O 

UI 

CO 


|SEQ ID n° 4745 | 


|SEQIDn°4746 | 


|SEQIDn°4747 | 


GO 

I s - 

o 

c 
Q 

O 
UJ 

CO 


|SEQ ID n° 4749 



ISDOCIO: <WO_0209281BA2_I_> 



* 



WO 02/092818 WV/IB02/03059 

356 




c 
o 



CO 
U 

">% 

u 

ID 



o 



E 
o 



0) 

to 

J5 
>» 
o 
ro 
to 
c 
ro 

c 

a> 

o 
k. 
a 



CD 
CO 

: t3 . 

I s 

' = . < 
o 
O 



c 
p 
«> 
E 
o 



a: 

CO 



CD 
to 

(0 

I— *- 

.§■£ 

CO *D 



c ; 


CO | 


©• 


vl 


S 




Q. 


;ac 


a> 




£| 




; re 


s ; 




o 


icyt 


o 



fit 

CO 

c 
o 



CO 



o o 

*- ' k- 
<0 JO 

EE 



i «o 

5 S 
I | £ 

S -S.il 

• ? 

; i 



^ c 

P\9 



• C CD 

X 

O O; O 

tr tr i 

(0 CO CO 



E E 
co co 



o 



OCM 
CM CM' 
-r- (CD) 

co f 
<? 

§ 



cojrnl^ 
olm " 

*-|CM 
O) CO 
C0!C0 
CO CO 



CM O) 
(ON 
CO I CD 



CM CO 
O O 
CO CO 



Qj Q. 



c 

CO 
O) 

c 

■o 
c 

a 



CD 

o 

CL 
CO 

c 

CD 
i-_ 

O 
CD 
< 

a 

.© 
E 
9 

JZ 

o 

I 

p 



= E 



C 

q. 



CD 

tr 
o 

CL 
CA 
C 

J? 
*-» 

O 

CD 
< 

a 

CD 

E 
o 
i_ 

£Z 
O 

o 

§• 

o 
ro 

E 

CO 



















tr 






























< 




































en, 






nal 


pa 






































CO 






























ein 






•terr 


(ern 






























2 






o 


c 






























































c 


c 




OL 






i_ 


























3 


3 




CO 






o 


o 
























.Q 


-O 




'to 






J2 


CO 
k. 
























3 


3 




CD 






3 


3 
























lase (s 


lase (s 


enase 


osynth 






n preo 


r» prec 




























o> 
o 


































X 


X 








rote 


CD 
























o 


o 


t— 

"O 


CD 






S 
























o 


*o 


*— 


C 

o 






Ql 


CL 
















CD 








|uin 


|uin 


del 


uin 






ted 


*o 

CD 
















cas 








bd ubiq 


bd ubiq 


NADH 


menaq 






nic secre 


: secre 




tein 






tein 




tein 


transio 




tein 




CD 


CD 


CO 


CO 






• 'c 




2 


c 




o 
i— 




e 


< 




e 




£ 


E 


o 


o 






CD 


• CD 






CD 




CL 




CL 






CL 


rotein) 


tochroi 


tochroi 


pothet 


potheti 






munog 


munog 




known 


ier pro 




known 




known 


ar to D 




known 


ase pi 


o 


o 


JO. 








ail 


E 




un 


Q 




un 




un 


I 




un 


o 


o 

-*— • 
I— 


o 


o 


wn 


wn 


o 


£ 


wn 


o 


O 




o 


c 


o 


CO 


c 


o 


CD 

c 


v_ 
(0 


CO 


ro 


CO 


no 


no 


i— 

CO 


lar 


no 


lar 


1— 

ro 


no 


lar 


no 


lar 


kly 


no 


ro 


c 

CD 


E 


E 


E 


I 


nk 


nk 


If 


mi 


nk 


c 
c 


1 


nk 


ILU 


c 


■~ 

E 


ea 


nk 


I 


CL 


CO 


CO 


CO 


CO 


z> 




CO Q_ 


CO 


z> 


co 


CO 




CO 




'co 




D 


CO 


E 




c 


c 


c 
c 


c 


c 


c 


c 
c 


c 


E 


b 


t: 


c 
c 


£ 


E 


c 
c 


c. 


c 
c 


00 




in 


CO 


CO 






o 




CO 




CO 




o 


co 




CO 


CM 


CO 


00 


o 


co 


XT 


to 


CD 


00 


CO 


co 


CO 




CM 




O) 






CD 


CO 


t— 


in 


to 


o 


CO 


CM 


o> 






CD 


CO 




co 


CD 


CO 


o 




CO 


00 






in 




CO 


o> 


CO 


CD 


o 


o 






CM 


CM 


CO 






CO 


00 


o 


to 


in 


in 


m 


m 


o 


o 
















r— 




*— 


T— 


CM 


00 


CO 


CO 


CO 


CO 




t — 




















x— 








^ — 




^~ 






x— 






















y— 




1 

o 


CO 


co 


CO 


d> 


1 


i 

CO 


1 

o 


1 

CO 


1 

CD 


CO 


oo 


i 

CM 


1 

CO 


i 

CO 


1 


i 

in 


i 

CD 


• 

O) 


I — 


CO 


C3 


CO 






CD 




CD 


o 


CD 


CO 






CD 


CO 


CM 


CM 


CO 


cx> 


in 


CD 




CO 


^J" 


CD 


CO 


O 


CD 






CO 




co 


o 




CO 


CO 


CM 


rr 


in 




CO 


CO 


00 


CD 


O 


O 






CM 


CM 


CO 






CO 


00 


m 


m 


in 


in 


m 


O 


O 


O 
























00 


CO 


00 


00 


CO 










t — 










T- 










CO 




co 


00 


oS 


CD 


CM 




ih 


CD 




CO 


CD 


d 




CM 




iri 


CD 










^~ 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


co 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


1 

< 


■ 

< 


1 

< 


i 

< 


t 

< 


i 


i 


i 

< 


1 

< 


i 

< 


i 

< 


1 

< 


i 

< 


1 

< 


1 

< 


< 


< 


< 


1 

< 


< 


< 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


o 




CM 


CO 




CO 




CD 


o 




CM 


CO 




CO 




CO 


O 




CM 


















in 


m 


m 


in 


m 


in 


m 


in 


CD 


to 


CD 










^ 
































m 


CO 




00 


o 


o 




CM 


CO 




m 


CD 




CO 


CD 


o 




CM 


CM 


CM 


CM 


CM 


CM 


CM 


CO 


CO 


CO 


CO 


co 


CO 


CO 


CO 


CO 


CO 






■^r 


to 


co 


CO 


CO 


CO 


CO 


CO 


CO 


co 


CO 


CD 


CD 


CO 


CO 


CO 


CD 


CO 


CO 


CD 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


o 




CM 


CO 




m 


CO 




CO 


CD 


o 


T— 


CM 


CO 




in 


CD 




CO 


CO 


CO 


CO 


CO 


co 


CO 


CO 


co 


CO 


CO 


























N- 




f*- 








h- 










h- 
















^1" 












TT 










^3" 










o 


0 


o 


o 


o 


o 


o 


o 


o 


o 


o 


o 


o 


o 


0 


o 


o 


o 


o 


C 


C 


c 


C 


C 


c 


C 


C 


tr 


C 


C 


C 


C 


C 


c 


C 


C 


C 


C 


Q 


Q 


Q 


Q 


Q 


Q 


Q 


Q 


Q 


Q 


Q 


Q 


Q 


Q 


Q 


Q 


Q 


Q 


D 


O 


O 


O 


a 


o 


o 


O 


O 


o 


O 


O 


O 


O 


O 


o 


O 


O 


O 


O 


LU 


UJ 


UJ 


UJ 


UJ 


UJ 


LU 


UJ 


UJ 


LU 


LU 


LU 


UJ 


LU 


LU 


LU 


LU 


LU 


LU 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 



o 

LU 

CO 



CM 
CO CO 



CO 



CO 
CM 

to 

CM 



O 

LU 
CO 



X3CID: <WO_0209281SA2_I_> 



WO 02/09281: 



357 



PCT/IB02/03059 































CD 


























se) 


iding 1 




































































se 




CD 
























CD 
















cer 




















ng 




tea 


\ea 


tz 




tas 
























ilas 
















CO 




















indi 




b 

CD 


b 
%— 

CD 


TP- 




onp 








































T3 
























Q. 


CL 


r(A 




























T5 
CO 
















i 

CL 




CD 
to 










1 










i— 




CD 
C 


CD 

tn 






















B 
















Q 




B 
















CD 




CD 


1 


CD 




nai 




































O 




o 










B 










tr 






























CO 


























CO 






o 




o 


O 


O 




E 
























c 
















rase 




















CL 




CL 


CL 


CL 




CO 


















CP 




CO 


CO 






fam 












C 










<raC/Xv 






CO 

c 




CO 

c 


CO 

c 


CO 

c 




CO 

o 


o 
















to 




to 


3 
















CO 














(0 




a 


E 


2 




o 


osp 
















s 


se 


na 


CD 






tr 










0) 




B 




CD 






I— 




t_ 












3 
















o 


V 


o 






cription regulator (Mar 










to 




CO 




to 






CD 




O 




o 


o 


o 




_CD 


JZ 










own protein 




own protein 


-keto-D-gluconate 5-redi 


r-phosphate isomera 


o-3-deoxygluconate 1 


iydro-3-deoxyphosph 




own protein 


se III (alpha subunit) 


eptidogiycan hydrolase 


ithetase 


protein 


phatidate cytidylyltrar 




caprenyl pyrophosph 


othetical permeases 


CO 

"O 

to 
o 

O 
3 
m 
t 

B 

CD 

_Q 

o 

CL 
CO 
/-» 


proteins 


own protein 


criptional regulator (/ 


ive channel transport 




nidine/putrescine AB 




nidine/putrescine AB 


nidine/putrescine AB 


nidine/putrescine AB 




-N-acetylenolpyruvoy 


)xymethylpterin pyrop 


Ironeopterin aldolase 


(ropteroate synthase 


rase 


cyclohydrolase 


nkn 




nkn 


uga 


-ket 


CD 

"9 




nkn 


ans 


tera 


INA syi 


ther 


hos 




nde 


hyp. 


\J 

x: 

CL 
i 


ther 


nkn 


ans 


utat 




perr 




perr 


perr 


perr 




IDP 


ydrc 


ihyd 


ihyd 


iteg 


GTP 


3 




3 


in 


(0 


CM 


CM 




3 




b 


CL 


o 


CL 




3 




CO 


o 


3 




CL 




CO 




to 


CO 


to 






JZ 


T5 


T3 




O 




O 


o 


2 


2 


2 


c 


O 


o 


>> 


o 


o 


.2 


0) 


2 




o 


o 


O 


2 


O 


c 


2 




2 


o 


2 




2 


2 


2 


o 


2 


2 




I 


















o 




UL 






to 




I— 




■*-• 


































i_ 




V. 


i— 




i— 


I— 


o 


i— 


*_ 


o 




I— 




(0 


i— 


CD 


\— 


t_ 


i— 




i— 


§ 


*— 










otein 






i— 








CD 


d 




JO 


CO 


(0 


mila 


a 


CO 


CO 


NA | 


CO 


-olyl- 


CO 


CO 


CO 


CO 


CO 


CO 


CD 


CO 


CO 




CO 


otei 


(0 


CO 


CO 


CO 


CO 


CO 


JO 


CO 


CO 


mil 


nki 


£ 


1 


mil 


mil 


nki 


mil 


1 


I 


mil 


mil 




mil 


1 


p 
c 


E 


E 


mil 


E 


nki 


mil 


mil 


mil 


mil 


I 


I 


I 


E 


mil 


mil 


to 




to 


to 




CO 


"(0 






(0 


Q 


CO 


o 






to 




CO 


'to 


CO 


CO 




to 














o 


to 


CO 


'co 


to 


CO 


to 


E 


E 


E 


: Q_ 


CL 


CL 


CL 


CL 


E 


E 


E 


E 


E 


E 




E 


E 


E 


E 


E 


E 


CL 


E 




- ■ 


E 


E 


E 




E 


E 


E 


E 


E 


E 


E 


lO 


CM 


CM 


CM 


m 


CO 


o 




CO 




I s - 




CM 


CO 




CO 


m 


CO 


CO 


CO 


in 


CO 


CO 


CL 




o 


CD 


o 




CO 


CD 




o 


in 


CM 


iO 




co 




in 


O 


CO 




I s - 


co 


CO 






CO 


o 


CO 


CM 


o 


CM 


h- 


co 


CD 




m 




T- 






CD 


CO 


CD 


CO 


CO 


CO 


CO 


CO 


CO 


CM 

m 


CO 

in 


CO 

CD 




CO 




CO 


CO 


CO 


o 




CO 


CO 




CO 




f- ) 


in 




CO 




CO 




co 




o 




CO 






CM 


CO 


o 


o 


CO 


CO 


O 


o 




m 


CO 


CO 


o 




o 


T- 


CO 




CM 


CO 




to 


O 




I s - 


OO 


CO 




o 


O 






CM 


CM 


CO 


OJ 


CM 


CM 


|CD 


CD 


CO 
CO 


I s - 


I s - 




I s - 




I s - 


co 




CO 


CO 




CM 


CM 


CM 


CM 


CM 


m 




CM 


CM 


CM 




CO 


CO 


CO 


CO 


CO 


CO 


CO 


X— 






CO 


CO 


CO 


a> 


o> 


CO 


CO 


CO 


co 


CO 




CO 


o> 


CM 


CM 


CM 


CM 


CM 


CM 


CO 
CM 




CM 


CM 


CM 




CM 


CM 


CM 


CM 


CM 


CO 


CM 






T |" 


i 


1 


1 


• 


1 
















*^ 












1 


















T 7" 






CM 




1 

CO 


i 

CD 


T— 


o 

CO 


o> 


CO 
CO 


CM 


CO 


■ 

CM 


1 

CO 


i 


1 

o 


1 

CO 


1 




T}- 


1 

CO 


i 

CD 


O 


i 

CO 


i 

"vt 


o 


i 

CD 


4 




• 


1 

CO 


i 

CO 




t 


i 

I s - 


CO 


i 

CO 


i 

CM 


i 

CO 


CD 




CO 


CM 




O 








I s - 


o 


o 


in 






LO 


CO 


O) 


CO 


O 


m 


CO 














CD 


CD 




CM 


CD 


CD 


CD 




CO 


CO 


CO 


CM 


CO 


CO 


CM 


CM 


o 


m 




CO 


I s - 




o 


CO 


CO 


CO 




CM 


CD 


CD 


CO 




CM 


co 






CO 


O 




CD 


CD 


O 




o 


o 


O 




in 


in 


CO 


CO 


o 






CD 


CD 


oo 






o 


CO 


CD 




CM 


CO 




-^r 




CO 


I s - 


CO 




CO 


O 


t — 






m 


CM 


CM 


CM 


CM 


CD 


CD 
CO 


CO 


CO 


CD 
CO 


r- 




I s - 


I s - 


I s - 


I s - 




CO 


CO 




T- 


CM 


CM 


CM 


CM 


CD 




CM 


CM 


CM 




CM 


CO 


CO 


CO 


CO 


CD 


CO 








o> 


CO 


at 


o> 


CO 


CO 


CO 


OJ 


co 




CO 


CO 


CM 


CM 


CM 


CM 


CM 


CM 


CM 




CM 


CM 


CM 




CM 


CM 


CM 


CM 


CM 


CM 


CM 




















r~ 








^ — 




T— 






T— 


T- 














T— 


T— 




T— 


T— 












T— 




CO 


CM 








CM 


T- 


x— 












T~ 


CO 


CM 










f— 






CO 




T— 


















I s -" 


CO 


co 


O 




c\i 


CO 




tn 


1^ 


CO 


CO 


o 






CM 


CO 


3 


in 


CO 




CO 


en 


CO 
CO 






CM 


CO 






ih 


CD 


I s - 


CO 




O 


CO 


CO 


CO 


3 


s 
















in 


in 




m 


in 


in 


in 


in 


in 


m 




CO 


CO 


CO 






CD 


CD 


CD 


CD 


CO 


I s - 


co 


CO 


CO 




co 


CO 


CO 


co 


CO 


CO 


CO 


CO 




CO 


CO 


CO 


co 


CO 


CO 


CO 


CO 




CO 


CO 


CO 






CO 


CO 


CO 


CO 


co 
















































, SA-' 




x— 




T— 














| SA-' 




< 


I 


< 


i 


I 


3 


i 


i 


i 




< 




< 








i 


I 


t 


i 


i 


I 


< 




< 


1 


< 














< 


CO 




CO 














CO 


CO 


CO 


CO 


CO 




CO 














CO 




CO 




CO 




CO 


CO 


CO 


CO 


CO 


CO 


co 




in 




CO 


CO 


o 




CM 


CO 


*T 


in 


I s - 


CO 






O 




CM 


CO 


M" 


in 


CD 


I s - 




CO 


CD 


o 






CM 


CO 




in 


CD 


I s - 


CD 


CD 


CD 


CO 


CD 


CO 


h- 






h- 


I s - 


I s - 


I s - 


I s - 




h- 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


00 




00 


CO 


CD 




CO 


CD 


CO 


s 


CD 


CO 


o> 






^- 




M" 














































'^r 


















CO 




m 


CD 


I s - 


CO 


CO 


o 




CM 


co 




in 


CD 






CO 


CO 


Q 


T— 


CM 


CO 




m 




CO 


I s - 


CO 




CO 


O 




CM 


CO 




m 










-<* 






m 


tn 


in 


in 


m 


m 


in 




in 


in 


in 


CO 


CD 


CD 


CO 


CD 


CO 




CO 


co 


CO 




CD 


I s - 




I s - 


I s - 




I s - 


CD 


CD 


CD 


CO 


CD 


CO 


CO 


CO 


CD 


CD 


CO 


CD 


CO 


CD 




CO 


CO 


CD 


CO 


CD 


CO 


CD 


CO 


CO 




CO 


CO 


CD 




CO 


CD 


co 


co 


co 


co 


co 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 




CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 




CM 


CM 


CM 




CM 


CM 


CM 


CM 


CM 


CM 


CM 


O) 


O 




CM 


CO 




in 


CD 




CO 


CO 


O 




CM 




CO 




m 


CO 


I s - 


CO 


CO 


O 






CM 


CO 






in 


CD 


I s - 


CO 


CD 


O 




h- 


CO 


00 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 




CO 


CO 


CO 


CD 


CO 


CD 


CO 


o 


O 




O 


o 


o 




o 


O 


o 


o 


O 






I s - 


r- 




I s - 


I s - 


I s - 




I s - 


I s - 


I s - 


I s - 




I s - 


I s - 




I s - 




I s - 


I s - 


I s - 


I s - 


I s - 


CO 


CO 




00 


CO 


CO 




CO 


CO 


CO 


CO 


CO 


CO 


00 
















^ 






















M- 






























T 




<vT 


o 


o 


o 


o 


o 


o 


o 


o 


o 


o 


0 


o 


o 


o 




o 


o 


o 


o 


o 


o 


o 


o 


o 




o 


o 


o 




0 


o 


o 


o 


0 


o 


o 


c 


C 


C 


C 


c 


C 


C 


C 


C 


C 


C 


C 


C 


c 




C 


C 


C 


C 


C 


C 


c 


c 


C 




cz 


C 


CZ 




C 


C 


C 


CZ 


C 


£Z 


C 




Q 


Q 


Q 


Q 


Q 


Q 


Q 


Q 


Q 


O 


Q 


O 


Q 




Q 


Q 


Q 


Q 


Q 


Q 


o 


Q 


Q 




Q 


Q 


Q 




Q 


O 


Q 


Q 


Q 


Q 


Q 


O 


O 


a 


O 


o 


O 


a 


a 


O 


O 


o 


O 


o 


O 




O 


O 


O 


O 


O 


O 


a 


O 


O 




O 


O 


O 




O 


o 


O 


a 


O 


O 


O 


ill 


at 


HI 


LU 


OI 


LU 


LU 


LU 


LU 


LU 


LU 


LU 


LU 


LU 




LU 


LU 


LU 


LU 


LU 


LU 


LU 


LU 


LU 




LU 


LU 


LU 




LU 


LU 


LU 


LU 


LU 


LU 


LU 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 




CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 




CO 


CO 


CO 




CO 


CO 


CO 


CO 


CO 


CO 


CO 



NSDOCID: <WO_ 0209281 BA2_I_> 



WO 02/092818 ^PlYIB02/03059 
W 358 



1 similar to folyl-polyglutamate synthetase 1 


similar to unknown protein I 


[similar tc homoserine kinase 


•similar to homoserine dehydrogenase 


Similar to nickel ABC transporter (binding protein) 


[Similar to nickel ABC transporter (permease) 


Similar to oligopeptide and nickel ABC transporter (permease) 


Isimilar to unknown proteins 


[Similar to oligopeptide ABC transporter (ATP-binding protein) 


Similar to oligopeptide or nickel ABC transporter (ATP-binding 
protein) 


uridylate kinase | 


| ribosome recycling factor 


Isimilar to unknown proteins 


similar to peptide methionine sulfoxide reductase 


similar to unknown proteins j 


similar to myosin-crossreactive streptococcal antigen (unknown 
function) 


similar to phosphate starvation inducible protein, unknown 
function 


Unknown 


similar to two-component sensor histidine kinase | 


similar to two-component response regulator (PhoB) I 


Similar to transcriptional regulator PhoU 


similar to phosphate ABC transporter (ATP-binding protein) 


similar to phosphate ABC transporter (permease) 


similar to phosphate ABC transporter (permease) 


similar to phosphate ABC transporter (binding protein) 


similar to single-strand binding protein 


similar to replication protein (plasmid) 


Unknown 


Similar to unknown proteins 


Similar to ribosomal protein L1 1 methyltransferase 


Similar to unknown proteins 


Similar to transcriptional regulators 


1233381-1234643 m 


] 1234645-1235532 m 


1235519-1236385 m 


1236387-1237670 m 


! 1647764-1649380 m 


| 1646833-1647777 m j 


E 

CO 
CO 
CO 
CO 
M" 
CD 

i 

CM 

o 

CO 
CO 


| 266230-266436 m 


| 1645251-1646039 m ! 


1644584-1645264 m 


E 

CO 

CO 
CD 

i 

in 

CO 
CO 
CO 


| 1643162-1643719 m | 


E 

O 

CO 

CO 
i 

o 

CD 
CM 

co 


i 1641543-1642052 m | 


1 1641331-1641546 m | 


1639401-1641173 m 


1638291-1639277 m 


1637397-1638200 p ] 


2028876-2030531 m I 


2030524-2031201 m j 


2031201-2031857 m | 


£ 

CO 

o 

CO 
CM 
CO 
O 
CM 
i 

in 

OO 

co 
o 

CM 


SA-1395.1 2032596-2033474 m I 


2033476-2034321 m | 


2034336-2035217 m | 


1035400-1035831 m ] 


266442-267230 m | 


2035418-2036005 m I 


2036002-2036742 m | 


2036742-2037695 m I 


2037692-2038150 m , 


2038274-2038990 p 


SA-1371.1 


| SA-1 372.1 


SA-1 373.2 


SA-1 374.3 


CO 
^ — 

< 

CO 


| SA-1 378.1 


SA-1 379.1 


i SA-1 38.1 


! SA-1 380.1 


SA-1 381.1 


| SA-1382.1 | 


i SA-1 383.1 | 


! SA-1 384.1 | 


| SA-1 385.1 | 


CO 
CO 

CO 

& 


SA-1 388.1 i 


SA-1 389.1 


SA-1 390.2 I 


SA-1 391. 2 I 


SA-1 392.1 | 


SA-1 393.1 | 


SA-1 394.1 | 


SA-1 396.1 j 


SA-1 399.1 | 


i 


SA-140.1 I 


526 j SA-1 400.1 | 


527 I SA-1401.1 | 


SA-1 403.1 | 


3 
I 


SA-1 405.1 | 


00 
CD 


CD 
CD 


o 
o 

lO 


o 
m 


CM 
O 

in 


CO 

o 
m 


o 
in 


m 
o 
m 


CD 
O 

in 


o 
m 


CO 
O 

in 


CD 
O 

in 


o 
m 


in 


CM 

T- 

m 


CO 

T— 

in 


m 


in 

LO 


CO 
1 — 

m 


h- 

T — 

m 


00 

m 


CD 
t — 

m 


o 

CM 

in 


CM 

in 


co 
CM 

in 


CM 

m 


m 

CM 

m 


CO 
CM 

m 


CD 
CM 

in 


o 

CO 

m 


2676 




2678 


2679 


| 2680 


! 2681 


2682 


| 2683 


| 2684 


2685 


| 2686 


I 2687 


I 2688 I 


| 2689 


2690 


2691 


CM 
CD 
CO 
CM 


2693 ) 


2694 


2695 ! 


2696 ! 


2697 


2698 ! 


2699 


2700 ; 


2701 


2702 


2703 j 


2704 


2705 


2706 


2707 [ 


|SEQ ID n° 4812 


|SEQ ID n° 4813 


|SEQIDn° 4814 


|SEQ ID n° 4815 


CD 

CO 

o 
C 

O 

o 

UJ 

CO 


|SEQIDn° 4817 


OO 
00 
o 

c- 
Q 

O 
UJ 
CO 


|SEQ ID n° 4819 


o 

CM 
00 
^" 

0 

C 

Q 

O 
UJ 

CO 


CM 
00 

o 
C 

Q 

O 
UJ 
CO 


SEQ ID n° 4822 


SEQ ID n° 4823 


SEQ ID n° 4824 


SEQ ID n° 4825 . | 


CD 
CM 
CO 

o 
C 

Q 

O 
UJ 

CO 


N» 
CM 
CO 

0 

C 

Q 

O 
UJ 

CO 


SEQ ID n° 4828 j 


CD 
CM 
00 

o 
C 

Q 

O 
UJ 

CO 


o 

CO 
OO 

o 
C 

Q 

O 
UJ 

CO 


SEQ ID n° 4831 \ 


CM 
CO 
00 

e 
C 

Q 
O 

UJ 

CO 


SEQ ID n° 4833 


S 

00 

^j- 

o 
C 

Q 

a 

UJ 

CO 


SEQ ID n° 4835 | 


SEQ ID n° 4836 ! 


SEQ ID n° 4837 


CO 
CO 
OO 

o 
C 

Q 

O 
UI 

CO 


O) 

CO 
CO 

o 
C 

Q 

O 
UJ 

CO 


SEQ ID n° 4840 


SEQ ID n° 4841 


CM 
OO 

0 

C 

Q 

O 
UJ 

CO 


CO 

s 

o 
C 

Q 

O 
UJ 
CO 



OCID: <WO_02092818A2J_> 



WO 02/0928 




PCMB02/03059 



0) 
CO 

r: 

CL 
CO 

O 

xz 

CL 

<? 
0> 

CO 

: O 

.1 



to 
c 

CD 
O 
Q> 

C _ 

oS o 
c c 

' 

C C 

3 3! 



TO 

E 

CO 



CD 

cd 
co 
O 
CM 
I 

CM 

o 

CD 
CO 
O 
CM 



CD 
O 

CO 



CO 

m 



GO 

o 

CN 



CO 

o 
C 

Q 
O 

LU 
CO 



oc c 

tr ! ^ , * 

co»o o 

r± C C 

c I c 

Z)'3 



0) 
CO 

c 1 CL 

o 

1% 
c 

$ CD 

o jq 

c P 

o o 
i? ro 

EE 

co £ 



CO 

c 

E 
t_ 

JD 

ro^ 

o 
ro 

D 

£ 

CO 

c 
o 

*.£ 

So, 

O lO 

* £ o 

IA O — 
CO c »- 

* ,5 E 
o 2 » 

ro 



*;* 



i 



!o> t: in! 
i in m co : 
!o cm m 

O'f^ o 
^ if- 
O'CD'O 
CM jCM . CM 
tit 

co jm 

cor- !o 
co'tD'^r i 

O CMIO' 
CM 1 CM j 



CO 

o 
* 

< 
CO 



CO 



1^ 
m 

co 
o 

CD 

t 

CO 

o> 
o 

CD 



O 

< 

CO 



m 

CO 

in 



c 
Q 

O 
LU 
CO 



CO 

i 

< 
co 



to 

CO 

m 



O 

LU 

CO 



e:e,e 



CM CO 

m 



CO 



\_ 
D 

cr 
d) 



3 

CD 

E 
k_ 
o 
ro 

CD 



2 

CL 

CD 

Q. 
CD 

cr 

id 

c 

CO 



a> 
*g 
*i— 

CO 
XI 

o 
o 

CO 
CO 

_>* 

o 

CL 

<D 
CO 

o 

<D 

to 
o 
c 

E 

CO 



c 

CD 

■4— » 

o 

I— 

CL 

o> 
c 



c 
>» 

CO 

o 



cd 

CO 
CO 



3 

to 
a> 

T3 

0) 
c 

CD 

to 
u 

CD 
> 

CO 

ZJ 
CL 

CD 
CO 



a. £ 



CO 

< 

CO 



to 
in 



CD 
CD 

in 
in 



o 
co 

I 



CD 

S 



in 

CM 
CM 



CO 
CO 
CO 
CD 

m 

CO 
CM 

CO 

in 



CD 

2 
3 



c 
a> 
o 
a_ 
c 

I 



o 
"c 

CD 

CD 
CO 
CO 

ig 

Q. 

CD 
CL 
>* 
X 

o 

CO 

o 

ro 

< 

Q 
i 

ro 

< 
Q 

(D 
CL 

a> 
c 

tZ 
CD 
10 

O 



CD 
CL 

CD 
(O 
CO 
■p 

CL 

CD 
CL 



O 

jQ 
v_ 

CO 

o 
ro 

< 

o 

ro 

< 
i 

Q 

CD 
CL 
^ 

c 

**- 

CD 
10 



c 

CD 

2 

CL 

ro 
E 
o 

CO 

o 
ja 
k. 

CO 
o 

ID 



c 

CD 

o 

CL 

CD 
C 

■o 
c 
In 

I 

o 

CL 
(O 

c 

s 

o 

CD 
< 

3 

CD 

E 
2 

Lm 

ro 

I 

to 



CD 
CO 
CO 

•g 

CL 
CD 
Q. 

T3 

o 



O 

m 

CM 
CD 

■ 

CM 

in 



CD 



CD 

m 
co 

o 
C 

Q 

O 
ill 

CO 



CD 
CO 

O 

C 

o 
o 

LU 
CO 



CO 
CO 

i 



m 

CO 



Ik 



s 



o 

CO 
CM 



CD 
CD 
00 

o 

c 
Q 

a 

LU 
CO 



CD 
CM 
CO 
CO 
CD 



s 

CM 
CO 



CD 
CO 



< 
CO 



in 
in 
in 



co 

CM 



CD 

co 

o 
C 

D 

a 

LU 

CO 



CM 

in 

CD 

T— 
I 

CM 
CO 
CD 
CO 
CD 



CO 



CD 



CD 

in 
in 



co 

CD 

oo 



O 
LU 
CO 



CM 
CO 
CO 



to 
c 

Q> 

2 
CL 

C 

I 

c 
c 



£5 
E 
CO 



CL 
CO 



oo 
o 

CO 
I 

m 

CM 

o 

CD 



CM 
CM 

5 



CM 

iri 



o 

O 

LU 

CO 



CO 
CO 

in 



CD 
CO 

CM 



m 

CO 



a 

LU 
CO 



NSDOCID: <WO_02092818A2_I_> 



WO 02/092318 



















i part) 






























































acetoin 


the 

•termina 






nzyme II 
























































(D- 


































































CD 
























































nase 


synthetase 
insynthetase 






PTS 










CO 


< 






CD 


rase 
























ase 








ise 


icase 


,3-butanediol dehydroge 






and to 


se 








zyme II 


zyme II 


mthase 


CD 


omeras 


i-epime 












ComX 


CD 


CD 






'n proteins 


lucleoside hydroli 


n proteins 


synthetase 


n proteins 


:e aminotransfera 


pendent DNA hel 


a-glutamylcysteine 
and to cyanophyci 


n proteins 




ptional regulators 


succinate syntha 




n protein 


/me IIC 


l-specific PTS en 


l-specific PTS en 


e-6-phosphate s\ 


acetyl transferas 


CO 

£ 

CL 
CO 

o 

£2 
CL 
• 

CO 
• 

CD 


se-5-phosphate A 


tical transaldolasi 






n proteins 


n proteins 


itive. sigma factor 


acetyl transferas 


hoglycerate mutasi 


boxypeptidase 


1 muramidase 








< 




ra 


CD 


CM 








o 






N 


o 


O 


hexulos 


CD 


hexulos 


o 


CD 








$ 




CD 


CO 

o 

1 

Q 
Q 




unkno 


purine 


unkno 


lyl-tRN 


unknot 


aspart- 


ATP-d 


meso- 


to gamm 
linal part) 


unkno 




transc 


adeny 




unkno 


>TS en 


mannil 


mannil 


putativ 


L-ribul 


hypoth 






unkno 


unkno 


the pu 


putativ 


phosp 


N-acei 


o 


o 


o 


en 


o 


o 

-*-» 


o 


imilar to 
irming) 


o 


nknown 


o 


o 


nknown 


o 


CD 


o 


o 


O 


o 


o 


o 


O 


nknown 


nknown 


o 


o 


o 

■4— » 


o 


o 
■*-* 


o 
■*— • 


O 

-«— ' 


imilar 


imilar 


imilar 


spara 


milar 


milar 


milar 


CD £ 

CD 

P **, 


imilar 


imilar 


imilar 


imilar 


utativi 


milar 


milar 


imilar 


milar 


imiiar 


imilar 


milar 


imilar 


imilar 


imilar 


milar 


imilar 


imilar 


imilar 








CD 


CO 


CO 


to 




'77% ~7 
CO 


CO 




CO 


CO 


— % 
> 


UJ 


CL 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


3 




CO 


CO 


CO 


"to 


CO 


CO 


CO 














I 




CL 


CL 




E 


E 


CL 


E 


E 


E 


E 


E 




E 


E 


E 




















p 


p 


p 


Q 


E 






o 


m 


CO 


CL 


h- 




CO 




CM 


m 


o 


CM 


CL 


CO 


CO 




t~\ 
u. 




CL 


CL 




CL 


CL 


CL 


CL 


CO 






I s - 


I s - 


O 




CO 




CO 


CM 


m 


CO 






CO 


CO 


CM 


CM 


CO 


in 


CO 


CO 




in 


CD 


in 






CO 


I s - 


CO 


o 




CD 


CO 




O 


CM 


O 


o 


in 




in 




CO 


CM 


^J* 


CO 


CD 


O 




CO 






CM 






in 


CO 


in 




co 


CO 








CO 




m 


CM 


CD 






m 


o 


CO 






CD 


«fr 








CO 


CM 


T— 




o 




o 






in 


CM 


CO 




CD 


m 


s 


CO 


CO 


CM 


CO 


CO 

CO 


CO 


o 


CO 


CM 


CM 


CM 


CM 


CM 


CM 


CM 




CM 


CM 


CM 




m 


CD 






CM 


CO 


CO 


CO 


o 


O 


o 




CO 


o 


O 


CO 


CO 




CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 




CO 


CO 


CO 


O 


o 


O 


o 


o 




o 


O 


o 


CD 




<? 




CM 


CD 
i 


<? 


in 

1 


1 


I 


CM 

• 




t — 


i 




t— 




1 — 


t— 




T— 




x— 


i . 


i 


i 


i 


1 


CM 
i 


x — 


i 


1 


• 

o 




I s - 


CM 


i 

CO 


I s - 




CM 


CO 


CO 




to 


i 

CM 


CO 


» 

O 


i 

co 


t 


1 

in 


f^- 


CO 


1 

o 


1 

CM 


t 


CO 


in 


in 


CO 


m 


CO 


CD 


m 




co 


CD 


o 


CO 


o 






CO 




CO 


CO 




in 


o 


CO 


CO 


CO 


m 


T— 


CO 


h- 




CO 


in 


CO 


CO 


in 




m 




o> 


CO 




CO 


m 


CO 


CO 




CO 


K 


CO 


o 


in 


CO 


in 


CO 


CO 


CO 




CO 


CO 




N- 




CM 




CO 


CO 


CM 


m 


CO 


m 


52 


CD 


in 




CO 


CO 


CM 


CO 


CO 


y- 


o 


o 


CO 


h- 




CO 




'^r 




CO 


o 


CM 


T — 






s 


m 


CD 




t— 




CO 


o> 


O 


o 


o 


o 


CO 


O 


CO 


a> 


CO 


CO 




CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 




CM 


CM 


CM 


o 




o 


o 


o 




O 


o 


o 


CD 


CO 


CO 


CO 


CM 


CD 


in 


m 


CO 


CO 


CM 


CO 


CO 


CO 


CO 


CD 


CO 


CO 


CO 


CM 


CO 

T— 


CO 
r— 


CO 








T— 


x— 


CM 






X — 


CD 


T— 












CM 


CM 


x — 






T— 








T — 












CO 






T— 


T- 












h-" 


CO 


CO 


in 


d 


x— 


co" 




CO 


CD 


d 


CM 


co" 


LO 


CO 




CO 


CO 


r-' 


d 




CM 




ih 




CO 


CO 


CO 


d 




CM 










m 


in 


in 


in 


in 


CO 


CO 


CO 


CO 


CD 


CO 


CO 


CD 




















CO 


CO 


CO 






































^- 




















-a- 




T— 








i SA- 


x— 


x— 








• 






i 










T— 


i 


x— 
























1 

< 


I 

< 


< 


< 


• 

< 


i 

< 


■ 

< 


< 


i 

< 


1 SA 


< 


< 


< 


1 

< 


i 

< 




t 

< 


1 

< 


SA 


i 

< 


1 

< 


i 

< 


1 

< 


< 


i 

< 


1 

< 


• 

< 


SA 


< 


< 


1 

< 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 




CO 


CO 


CO 


CO 


CO 




to 


CO 




co 


CO 


o 




CO 




in 


CD 




CO 


CO 


o 




CN 


CO 




m 


CD 




CO 


o 




CM 


CO 




m 


CO 


I s - 


CD 


CD 


CO 


CO 


CO 


CD 


I s - 


r- 


I s - 






I s - 








CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


lO 


in 


in 


in 


m 


m 


m 


m 


in 


m 


in 


m 


m 


in 


m 


m 


m 


in 


in 


in 


m 


in 


m 


m 


m 


m 


in 


in 


m 


in 


m 


m 


O 




CN 


CO 




in 


CD 


h- 


CO 


CO 


o 




CM 


CO 




m 


CD 




CO 


CO 


o 




CM 


CO 




in 


CO 


h- 


CO 


CO 


o 






^ 


^3" 










-^r 






m 


m 


tn 


in 


to 


m 


in 


m 


in 


m 


CD 


co 


CO 


CO 


co 


CO 


CO 


CD 


CD 


CO 


I s - 


I s - 




I s - 


I s - 




I s - 


r^- 




I s - 


I s - 


I s - 




I s - 


















h- 
















I s - 




r- 


I s - 


CM 


CN 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CO 


I s - 


CO 


CO 


o 


T— 


CM 


CO 




in 


CD 




CO 


CO 


o 


T— 


CM 


CO 




m 


CD 




CO 


CO 


o 


T— 


CM 


co 


^3" 


in 


CO 


I s - 






r-. 




CO 


CO 


CO 


CO 


00 


CO 


CO 


co 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


o 


o 


O 


o 


O 


o 


O 


O 


CO 


co 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 












•sr 


^ 


^J" 












































^J- 






o 


o 


o 


o 


o 


o 


0 


0 


o 


o 




0 


o 


0 


o 


o 


o 


o 


0 


o 


o 


o 


o 


0 


o 


0 


0 


o 


o 


o 


o 


o 


C 


C 


C 


CZ 


C 


C 


C 


C 


C 


C 


C 


c 


C 


C 


C 


C 


C 


C 


C 


c 


C 


C 


C 


C 


c 


c 


C 


C 


C 


C 


C 


c 


O 


Q 


O 


Q 


O 


Q 


Q 


O 


Q 


O 


O 


Q 


Q 


Q 


Q 


Q 


Q 


Q 


Q 


O 


Q 


Q 


Q 


Q 


Q 


Q 


Q 


D 


Q 


Q 


Q 


Q 


a 


O 


a 


O 


o 


O 


O 


o 


O 


o 


o 


O 


O 


O 


O 


O 


a 


O 


O 


O 


O 


O 


O 


O 


O 


O 


O 


O 


a 


O 


a 


O 


LU 


Ol 


LU 


LU 


LU 


LU 


LU 


LU 


LU 


LU 


LU 


LU 


LU 


LU 


LU 


LU 


LU 


LU 


LU 


LU 


LU 


LU 


LU 


LU 


LU 


LU 


LU 


LU 


LU 


LU 


LU 


LU 


CO 


co 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO|CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 



360 




7IB02/03059 



XDCID: <WO_0209281 BA2_L> 



WO 02/09281^^ PCT/IB02/03059 



Similar to transcription repressor of class 1 heat-shock (HrcA) 


Similar to heat shock protein GrpE ! 


Chaperone protein DnaK | 


Chaperone protein DhaJ | 


similar to unknown protein | 


ribosomal protein L11 " -~ | 


similar to transmembrane efflux pump protein j 


similar to hypothetical N-acyl-L-amino acid amidohydrolase | 


similar to transcriptional regulator (LysR family) I 


similar to unknown proteins 


similar to para-amlnobenzoate synthase, component I | 


Similar to DNA translocase ! 


similar to peptidyl-prolyl cis-trans isomerase ! 


similar to surface antigen proteins, putative peptidoglycan bound 
protein (LPXTG motif) 


similar to unknown proteins I 


similar to metal ABC transporter (permease) 


similar to metal ABC transporter (ATP-binding protein) I 


similar to metal ABC transporter (binding protein) I 


similar to C5A peptidase, putative peptidoglycan linked protein 
(LPXTG motif) 


similar to two-component response regulator I 


similar to two-component sensor histidine kinase ] 


Unknown 


similar to RNA polymerase ECF sigma factor 


leucyl-tRNA synthetase 


similar to unknown proteins I 


similar to competence protein ComFC I 


competence protein ComFA 


similar to unknown proteins 


similar to cysteine synthetase A I 


similar to glycerol dehydrogenase | 


similar to hypothetical transaidoiase 


similar to transcriptional regulator (TetR/AcrR family) I 


similar to formate acetyltransferase [ 
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similar to unknown proteins 1 


similar to branched-chain-amino-acid aminotransferase j 


Similar to topoisomerase IV subunit A 


similar to DNA topoisomerase IV (subunit B) ( 


similar to unknown proteins I 


Uracil DNA glycosylase I 


similar to unknown proteins 


CMP-N-acetylneuraminic acid synthetase 1 


Similar to ABC transporter (permease) 


similar to glycosyiation or acetylation protein 


similar to UDP-N-acetylglucosamine-2-epimerase I 


similar to N-acetylneuraminic acid synthetase I 


capsular polysaccharide repeat unit transporter 


similar to ABC transporter (ATP-binding protein) I 


putative ABC transporter (permease) I 


similar to unknown transmembrane protein I 


similar to acetyltransferase (chloramphenicol ?) [ 


Unknown 


similar to cation-transporting P-ATPase 


similar to peptide methionine sulfoxide reductase 


similar to unknown proteins 


similar to unknwon proteins i 


weakly similar to histidine triad protein, putative lipoprotein I 


1 .2 Transport/binding proteins and lipoproteins 


Putative peptidoglycan bound protein (FPXTG motif) I 


similar to hypothetical sortase protein (N-terminal part) I 


similar to putative surface protein (sortase) 


Unknown | 


Unknown | 


similar to unknown proteins 


Unknown j 


Putative cell wall protein, weakly similar to peptidase or esterase 


similar to ABC transporter (ATP-binding protein) 


similar to unknown proteins, putative transmembrane protein 


similar to unknown proteins, putative transmembrane protein 
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Similar to unknown proteins 1 


Similar to Ribonuclease HII 


similar to unknown proteins | 


Similar to signal peptidase 1 I 


Similar to putative exodeoxyribonuclease V 1 


Similar to unknown proteins j 


Similar to DNA-damage-inducible protein P | 


Similar to Pyruvate formate-lyase | 


Similar to FMN-binding protein | 


1841061-1841990 m ;Similarto unknown proteins | 


Similar to C3-degrading proteinase 


Similar to unknown protein | 


Similar to glycerol uptake facilitator | 


Similar to unknown protein I 


Similar to efflux protein | 


similar to ABC transporter (permease) | 


| similar to ABC transporter (ATP-binding protein) i 


j similar to ABC transporter (permease) | 


I similar to other proteins | 


similar to unknown proteins I 


similar to transposase I 


similar to transposase I 


similar to transposase I 


Isimilar to insertion elemant protein | 


similar to integrase C-terminal part (truncated) I 


| ribosomal protein L19 I 


(similar to unknown proteins ! 


Isimilar to other proteins | 


Isimilar to N-acetylglucosamine-6-phosphate deacetylase | 


Isimilar to flavodoxin j 


i 614783-615805 p similar to adenosine deaminase | 


[similar to unknown proteins I 


|30S ribosomal protein S14 I 


| similar to low specificity L-threonine aldolase I 


Similar to other proteins (includin putative glycoprotein 
endopeptidase) 
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I 621359-621520 m j 


I 620914-621 186 p i 


| 620591-620851 p | 
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i 618920-619540 m | 


! 618428-618775 p | 
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Similar to putative acetyltransferase 1 


Similar to other proteins (includin putative glycoprotein 
endopeptidase) 
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Similar to glucose-inhibited division protein GidB ] 


|8imilar to unknown proteins 


Similar to other proteins j 


Similar to unknown proteins | 


! Similar to two-component response regulator { 


i 1735822-1737327 m 'Similar to two-component sensor histidine kinase | 


[Similar to two-component response regulator " — I 


similar to other proteins [ 


similar to unknown proteins j 


similar to unknown proteins J 


similar to diacylglycerol kinase | 


similar to GTP binding proteins | 


Unknown j 


Unknown | 


Similar to two-component sensor histidine kinase I 


Unknown | 


jsimilar to transcriptional regulator | 


Isimilar to formamidopyrimidine-DNA glycosylase | 


similar to dephosphocoenzyme A kinase | 


jsimilar to ABC transporter (ATP-binding protein) | 


|Unknown j 


Isimilar to mevalonate kinase i 


Isimilar to efflux pump | 


Similar to glucan 1 ,6-alpha-glucosidase | 


Similar to UDP-galactose 4-epimerase | 


similar to two-component response regulator | 


Isimilar to two-component sensor histidine kinase j 


isimilar to organic acid transport protein | 


similar to malic enzyme ((S)-malate:NAD+ oxldoreductase) | 


similar to mevalonate diphosphate decarboxylase j 


Jsimilar to transctiptional regulator CtsR j 


[Similar to endopeptidase CIp ATP-binding chain C I 


|Similar to acyltransferase ] 


similar to deoxypurine kinase subunit | 


{Similar to transcription regulator | 


Similar to other proteins | 
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Unknown j 


chaperonin GroEL j 


similar to multidrug resistance protein 


Ribosomal protein L10 I 


Similar to unknown proteins | 


excinuclease ABC (subunit C) | 


Transmembrane N-terminal domain, C-terminal domain similar 
to hydrolases 


similar to NADH dehydrogenase j 


similar to dipeptidase I 


similar to unknown proteins ! 


similar to unknown proteins | 


1429976-1430341 m ribosomal protein L7/L12 | 


,Hpr (ser) kinase/phosphatase 


Similar to unknown proteins | 


Similar to unknown proteins | 


Similar to unknown proteins j 


Simiiar to oxidoreductase 


Similar to unknown proteins 


Similar to unknown proteins 


Similar to unknown proteins 
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binding protein) 
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|Similar to permease (gluconate ?) ) 


| Similar to putative glycerate kinase | 


[similar to unknown proteins I 


Similar to unknown proteins 


Similar to beta-glucosidase I 


ribosomal protein S1 7 j 


|ribosomal protein L29 | 


Iribosomal protein L16 I 


ribosomal protein S3 | 


ribosomal protein 122 1 


ribosomal protein S19 | 


similar to plasmid transfer complex protein TrsK I 


ribosomal protein L2 | 


ribosomal protein L23 | 


Iribosomal protein L4 | 


ribosomal protein L3 j 


ribosomal protein S10 | 


similar to transposase (truncated) | 


similar to transposase, N-terminal part j 


Unknown j 


Unknown | 


streptococcal C5a peptidase I 


Similar to sucrose-6-phosphate hydrolase l 


Similar to transcriptional regulator (Lad family) I 


Similar to transcription termination protein NusB | 


Similar to unknown proteins | 


Similar to translation elongation factor EF-P f 


similar to ABC transporter (ATP-binding protein) | 


similar to ABC transporter (binding protein) [ 


glucose-6-phosphate isomerase 


similar to unknown protein ] 


similar to unknown protein | 


similar to putative ABC transporter (binding protein) I 


Unknown | 


similar to unknown protein from conjugative transposon j 


similar to UDP-glucose pyrophosphorylase j 
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| similar to glycerol-3-phosphate dehydrogenase 


similar to ribonuclease P protein component | 


similar to unknown protein and to B. subtitis SpolllJ protein | 


Unknown " | 


Unknown j 


similar to hypothetical transcriptional regulator | 


Unknown | 


Unknown | 


similar to unknown protein from conjugative transposons ! 


Unknown | 


Similar to unknown proteins | 


Unknown j 


Unknown | 


| Unknown | 


Unknown ) 


Unknown I 


Similar to manganese-dependent inorganic pyrophosphatase | 


Isimilar to plamsid transfer complex protein TraE I 


Similar to pyruvate-formate lyase activating enzyme ! 


Similar to unknown protein | 


Similar to unknown proteins 


Similar to unknown protein j 


Similar to unknown protein I 


similar to unknown protein I 


similar to transposase | 


Regenerate transposase ) 


degenerate trnasposase j 


; Degenerate transposase | 


Similar to histidine triad protein j 


laminin-binding surface protein | 


similar to two-component response regulator VncR ) 


similar to two-component sensor histidine kinase VncS I 


Similar to transposase C-terminal end (truncated) . } 


Similar to unknown proteins ! 


similar to plasmid and conjugative transposon protein 


similar to FtsW and RodA proteins 
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similar to unknown protein | 


DNA gyrase, subunit 6 


similar to two-component response regulator | 


ribosomal protein L34 | 


Similar to unknown proteins j 


similar to betaine ABC transporter permease and substrate 
binding protein 


similar to glycine betaine ABC transporter (ATP-binding protein) 


similar to transcription antltermination factor nusG ! 


similar to glycosyl transferase j 


similar to glycosyl transferase | 


similar to unknown protein | 


similar to unknown proteins I 


similar to transporter | 


similar to staphylokinase and streptokinase I 


similar to unknown protein | 


similar to unknown protein | 


similar to succinic semialdehyde dehydrogenase I 


similar to glycine betaine transporter (N-terminal end) I 


similar to glycine betaine transporter (C-terminal end) I 


similar to unknown protein C-terminal part | 


similar to unknown protein (N-terminal part) | 


similar to unknown proteins | 
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Similar to surface proteins, putative peptidoglycan linked protein 
(LPXTG motif) 


similar to cardiolipin synthetase | 


similar to formate-tetrahydrofolate ligase j 


similar to lipoate-protein ligase | 


similar to unknown protein | 


similar to ATP-dependent CIp protease ATP-binding subunit 
ClpA 


Putative peptidoglycan linked protein (LPXTG motif) | 


similar to trigger factor. (prolyl isomerase) I 


similar to unknown protein | 
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Similar to drug-export protein | 


Unknown 


similar to Gamma-glutamyl phosphate reductase I 


similar to gamma-glutamyl kinase I 


similar to Similar to beta-glucoside specific PTS system enzyme 
IIBC 


Unknown j 


Transmembrane protein similar to unknown proteins I 


Similar to ABC transporter (ATP-binding protein) ? 


Hypothetical gene | 


ribosomal protein L14 | 


similar to unknown proteins j 


similar to transketolase 


Similar to unknown proteins | 


similar to transcriptional regulatory protein (N-terminal part) | 


similar to NADH oxidase I 


similar to phage protein j 


similar to glycerol uptake facilitator 


similar to unknown protein j 


50S ribosomal protein L35 I 


translation initiation factor IF-3 | 


glycerol-3-phosphate dehydrogenase I 


Similar to cytidine monophosphate kinase j 


Similar to unknown proteins (serine rich) | 


glycerol kinase I 


similar to unknown proteins 


similar to unknown proteins | 


glycyl-tRNA synthetase (beta subunit) | 


Similar to unknown proteins | 


Similar to unknown proteins 


similar to acyl carrier protein phosphodiesterase | 


giyceraldehyde 3-phosphate dehydrogenase 


similar to unknown proteins J 


1720770-1721627 m 
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glycyl-tRNA synthetase (alpha subunit) | 


Unknown I 


similar to unknown proteins 


similar to transcriptional regulator (Lad family) I 


Unknown I 


Unknown j 


similar to transcriptional regulator (phage related) 


Similar to unknown proteins 


similar to unknown proteins 


Similar to pullulanase, Putative peptidoglycan bound protein 
(LPXTG motift 


Similar to unknown proteins 


hypothetical protein 


similar to pseudouridylate synthase 


similar to transcriptional regulator 


similar to ribose-phosphate pyrophosphokinase 1 


similar to putative permease 


Unknown 


similar to unknown plasmid protein 


Unknown 


Similar to unknown proteins 


Unknown 


similar to plasmid proteins 


sjmilar to unknown proteins 


Unknown 


similar to unknown proteins 


chaperonin GroES 


Similar to ABC transporter (ATP-binding protein) 


Similar to ABC transporter (ATP-binding protein) 


Similar to amino acid ABC transporter (binding protein) 


similar to deoxyuridine 5 -triphosphate nucleotidhydrolase 
(dUTPase) 


similar to tRNA isopentenylpyrophosphate transferase 


translation initiation factor IF-1 


similar to transposase 


similar to transposase, C-terminal part 


282183-283097 p 


1106781-1107011 m 


281328-281870 p 


1919967-1920950 m 


508125-508481 p 


508546-508968 m 
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similar to pyrimidine biosynthetic operon repressor I 


large conductance mechanosensltive channel protein MscL 


similar to GTP-binding protein I 


similar to xanthine phosphoribosyltransferase I 


similar to hypothetical transcriptional regulator I 


similar to unknown proteins | 


similar to unknown proteins | 


similar to putative plasmid replication protein I 


Unknown | 


similar to plasmid partition protein ParA | 


Unknown ] 


similar to unknwon proteins ( 


Unknown § 


similar to plasmid protein | 


Unknown | 


similar to unknown protein | 


Unknown | 


similar to plasmid protein j 


Unknown | 


similar to single-strand binding protein | 


Similar to unknown proteins f 


similar to surface antigen proteins, putative peptidogiycan bound 
protein (LPXTG motif) 


similar to unknown protein, putative peptidogiycan bound protein 
(LPXTG motif) 


Putative peptidogiycan bound protein (LPXTG motif) I 


Unknown j 


6 No similarity | 


similar to ATP-dependent CIp protease ATP-binding subunit 
ClpA 


similar to DNA topoisomerase III j 


similar to plasmid proteins 


Unknown | 


similar to unknown proteins | 


Unknown | 


similar to unknown proteins | 


1493128-1493649 m 


1557873-1558250 p 


1332440-1333678 m ! 


1169149-1169730 m ! 


1245656-1245853 p 
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Unknown | 


Unknown j 


Unknown j 


similar to oxidoreductase I 


Unknown j 


hypothetical start codon | 


Unknown | 


Unknown ] 


Unknown | 


Unknown | 


Unknown | 


similar to similar to single-strand DNA-specific exonuclease 
RecJ 


Unknown | 


similar to unknown proteins j 


Unknown | 


Unknown j 


similar to plasmid replication protein ] 


Unknown j 


Unknown | 


hypothetical gene 


Unknown | 


similar to putative hydrolytic protein 


similar to unknown proteins 


Similar to amino acid ABC transporter (binding protein) 


ribosomal protein S7 • j 


ribosomal protein S12 I 


similar to adenine phosphoribosyltransferase I 


similar to hypothetical thioredoxin I 


similar to unknown proteins \ 


similar to unknown proteins I 


similar to unknown proteins 


ATP-dependent CLP protease proteolytic subunit 


similar to unknown proteins 


similar to unknown proteins [ 


ribosomal protein S21 | 
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| 1350730-1351386 p | similar to unknown proteins | 


j similar to unknown proteins ! 


(Similar to unknown proteins 


similar to N-terminal first 100 amino acids of anaerobic 
ribonucleotide reductase 


[similar to probable D-amino acid oxidase 


[Unknown 


similar to piasmid transfer complex protein 


'Unknown j 


| similar to piasmid proteins I 


similar to surface antigen proteins, putative peptidoglycan bound 
protein (LPXTG motif) 


[Unknown | 


(Unknown | 


glucose-1 -phosphate thymidyltransferase | 


437152-437463 p Unknown | 


similar to replication initiation protein from Staphylococci piasmid 


[Unknown j 


(similar to piasmid partition protein ParA | 


j Unknown | 


|dTDP-4-keto-6-deoxyglucose-3,5-epimerase I 


similar to piasmid proteins | 


similar to unknown protein I 


Unknown | 


Unknown | 


similar to unknown proteins J 


Unknown \ 


similar to single-strand binding protein j 


similar to piasmid transfer complex protein | 


similar to membrane nuclease | 


Putative peptidoglycan bound protein (LPXTG motif) | 


similar to piasmid surface exclusion protein, putative 
peptidoglycan bound protein (LPXTG motif) 


similar to unknown proteins ) 


Unknown | 
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similar to ATP-dependent DNA helicase | 
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(Similar to other proteins — J 


Similar to decarboxylase 


Similar to unknown proteins 


Similar to hypothetical transcriptional regulators 


simiiar to unknown proteins 


Similar to surface proteins, putative peptidoglycan bound protein 
(LPXTS motif) 


similar to ABC transporter (permease) 


Similar to ribonucleoside-diphosphate reductase 2 alpha subunit 


Similar to unknwon proteins 


similar to ribonucleoside-diphosphate reductase beta chain I 


similar to rhamnosyltransferase 


Putative peptidoglycan bound protein (LPXTS motif) similar to 
C5A peptidase 


similar to unknown proteins | 


Similar to purine nucleoside phosphorylase 


similar to ABC transporter (ATP-binding protein) ! 


Similar to other proteins including hypothetical 
methyltransferases 


Similar to unknown proteins | 


Similar to unknown proteins 


Similar to unknown proteins | 


Similar to putative glucosyl transferase 


Similar to preprotein translocase secA | 


Similar to unknown proteins I 


Similar to unknown protein | 


Similar to unknown protein | 


Similar to preprotein translocase secY j 


Similar to hypothetical glycosyl transferase 


Similar to putative glycosyltransferase | 
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| Similar to unknown proteins ! 


I Similar to Pyruvate Phosphate Dikinase I 


(Similar to Glu-tRNA Gin amidotransferase subunit C 


| Similar to Glutamyl-tRNA Gin amidotransferase subunit A [ 


| Similar to Glu-tRNA amidotransferase subunit B I 


! Similar to unknown proteins | 


[Similar to unknown proteins 


[Similar to unknown proteins | 


[Similar to unknown proteins j 


[similar to integrase, C-terminal part 


[Similar to probable nicotinate-nucleotide adenylyltransferase 


iSimilar to unknown proteins 


similar to unknown proteins I 


Similar to unknown proteins j 


[Similar to transporter (antiporter) j 


Similar to UDP-N-acetylmuramoylalanyl-D-glutamyl-2,6- 
diaminopimelate-D-alanyl-D-alanyl ligase 


Similar to D-alanine-D-alanine ligase | 


ISimilar to recombination protein RecR j 


Similar to penicillin binding protein 2B 


Similar to phosphoglycerate mutase | 


Unknown | 


Similar to triosephosphate isomerase | 


elongation factor Tu | 


Similar to cell division protein FtsW and to RodA protein I 


Similar to phosphoenolpyruvate carboxylase I 


Similar to oligopeptidase I 


Similar to unknown proteins I 


Similar to unknown proteins 


Similar to two-component response regulator | 


Similar to bacteriophage endolysin j 


Similar to other proteins j 


Similar to transcriptional regulator j 


Similar to putative phosphoglycerate mutase I 


Similar to unknown proteins j 


lysyl-tRNA synthetase | 
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Similar to riboflavin synthase complex beta chain 1 


Similar to GTP cyclohydrase II/ 3,4-dihydroxy-2-butanone-4- 
phosphate synthase 


Similar to ribiflavin synthase alpha chain | 


Similar to two-component sensor histidine kinase j 


Similar to riboflavin specific deaminase 
(diaminohydroxyphosphoribosylaminopyrimidine deaminase/5- 
amino-6-(5-phosphoribosylamino)uracil reductase) 


Similar to manganese transporter | 


Similar to unknwon proteins I 


Similar to unknown proteins I 


Similar to putative peptidases | 


Similar to putative proteases j 


Similar to glucose-specific PTS enzyme 1 1 ABC I 


Similar to unknown protein I 


similar to two-component response regulator I 


Similar to two-component sensor histidine kinase (C-terminal 
part) 


similar to ABC transporter (ATP-binding protein) j 


Putative transmembrane protein I 


Similar to other proteins, putative transmembrane protein | 


Similar to mannose-specific PTS enzyme HA | 


Similar to mannose-specific PTS enzyme MB | 


similar to putative membrane arginine transporter i 
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similar to two-component response regulator | 


Similar to iron ABC transporter (binding protein) | 
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Similar to GTP pyrophosphokinase (stringent response protein 
RelA) 


iSimilar to unknown proteins 


Similar to adhesion proteins S 


similar to pneumococcal histidine triad protein B precursor (N- 
terminal part) 


similar to pneumococcal histidine triad protein B precursor (C- 
I terminal part) 


Similar to transcriptional regulator, DeoR family 


similar to two-component response regulator ! 


similar to ornithine carbamoyltransferase 


theronyl-tRNA synthetase 


similar to glucosyl transferase j 


similar to hexosyltransferase 


similar to alpha-amylase 


catabolite control protein A I 


similar to X-Pro dipeptidase 


similar to beta-N-acetylglucosaminidase 


Unknown 


similar to oxidoreductase 


Similar to hypothetical two-component sensor histidine kinase 


similar to D-mannonate hydrolase | 


similar to glucuronate isomerase 


similar to 2-dehydro-3-deoxyphosphogluconate aldolase I 


similar to transcriptional regulator (GntR family) 


similar to beta-glucuronidase I 


similar to 2-keto-3-deoxygluconate kinase 


similar to transporter | 


similar to D-lactate dehydrogenase 
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putative transmembrane protein 


similar to ABC transporter (ATP-binding protein) i 
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similar to transcription termination-antitermination factor nusA 


similar to unknown protein 


similar to putative ribosomal protein j 


membrane protein similar to other proteins 


initiation factor 2 


ribosome binding factor A I 


similar to esterase 


similar to negative transcriptional regulator (copper transport 
operon) 


similar to copper-transporting ATPase (CopA) I 


similar to copper chaperone (copper transport operon) 


similar to unknown protein j 


similar to unknown protein 


similar to other proteins j 


DNA polymerase I 


similar to unknown protein | 


simiular to transcription regulator (Fur family) I 


similar to fibrinogen binding protein, putative peptldoglycan 
linked protein (LPXTG motif) 


similar to two-component response regulator | 


similar to two-component sensor histidine kinase I 


similar to unknown protein 


similar to tRNA-guanine transglycosylase | 


similar to unknown proteins j 


similar to unknown protein (putative zinc finfer motif) I 


similar to biotin synthase | 


similar to unknown protein 


similar to unknown protein | 


similar to unknown proteins 


similar to negative regulator of FtsZ ring formation protein EzrA 


similar to phosphoserine phosphatase I 


similar to unknown proteins | 


similar to unknown proteins | 


enolase 1 
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455815-456294 p I 
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similar to unknown proteins 1 


similar to 5-enolpyruvylshikimate-3-phosphate synthase I 


similar to shikimate kinase ] 


Similar to membrane bound transcriptional regulator I 


similar to putative RNA methyltransferase I 


hypothetical CDS I 


similar to diadenosine tetraphosphatase, acid phosphatase | 


similar to unknown proteins | 


similar to putative transcriptional regulator (TetR/AcrR family) C- 
terminal part 


similar to putative transcriptional regulator (TetR/AcrR family) N- 
terminal part 


similar to C protein alpha-antigen from Streptococcus 
agalactiae] N-terminai part 


similar to transposase, truncated. I 


similar to unknown proteins j 


similar to transcriptional regulator (TetR/AcrR family) | 


similar to transposase N-terminal part 


similar to unknown protein. j 


similar to chaperonin (heat shock protein 33 homolog) 


similar to transcriptional regulator (C-terminal part) | 


similar to transcriptional regulator (N-terminal part) | 


Putative peptidogiycan bound protein (LPXTG motif) ! 


Putative peptidogiycan bound protein (LPXTG motif) j 


similar to sortase protein | 


similar to sortase protein | 
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SEQ ID n° 6593 


|SEQ ID n° 6594 | 


|SEQ ID n° 6595 | 
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1896767-1898032 m Isimilar to LJA D-alanylation protein DItB | 


putative ABC transporter (permease) [ 


Similar to D-alanyl carrier protein I 


similar to LTA D-alanine transfer protein DltD I 


Unknown | 


Unknown . | 


Unknown | 


i Unknown I 


isimilar to unknown proteins | 


similar to unknown proteins | 


histidine triad family protein | 


Similar to 16 rRNA (adenine-N6,N6-)-dimethyltransferase j 


1 .2 Transport/binding proteins and lipoproteins | 


Similar to 23S ribosomal RNA methyltransferase | 


similar to unknown proteins j 


similar to ribulose-5-phosphate 3-epimerase | 


Similar to unknown proteins j 


Similar to unknown proteins j 


similar to unknown proteins | 


similar to transcription repressor of purine operon PurR | 


qimilar to unknown proteins 


similar to pyrroline-5-carboxylate reductase [ 


SA-98.1 ; 2188934-2189728 m | 


I 1896513-1896752 m | 


! 1895258-1896520 m | 


! 1894691-1895083 m I 


! 1893399-1894691 m | 


! 1893016-1893408 m | 


! 1892725-1893006 m | 


I 1891761-1892543 m | 


i 1891208-1891774 m | 


! 1890755-1891204 m I 


1889856-1890728 m ! 


| 2189721-2190563 m i 


! 1889001-1889852 m ! 


I 1887973-1888845 m | 


! 1887304-1887966 m | 


! 1886679-1887311 m | 


! 1885403-1886677 m | 


| 1884472-1885413 m 1 


I 1883563-1884375 m | 


| 200712-201377 p j 


201398-202168 m 


SA-978.1 I 


SA-980. 1 ! 


SA-981.1 | 


SA-982. 1 | 


SA-983. 1 | 


! SA-984.1 


SA-985. 1 I 


SA-986.4 I 


SA-987.4 ] 


SA-988.4 


! SA-989. 1 


SA-99. 1 | 


SA-990. 1 i 


1 SA-991. 1 I 


j SA-993. 1 j 


SA-994. 1 I 


! SA-995. 1 


SA-996.1 


S SA-997.2 


CN 
CO 

cn 
cn 

St 


SA-999.1 


2323 I 


2324 | 


| 2325 | 


! 2326 j 


2327 | 


| 2328 | 


| 2329 i 


| 2330 | 


| 2331 ! 


| 2332 i 


! 2333 I 


I 2334 | 


! 2335 | 


i 2336 


! 2337 | 


| 2338 | 


i 2339 i 


I 2340 | 


i 2341 I 


I 2342 i 


| 2343 | 


2344 


|SEQIDn°6596 | 4460 


4461 | 


i 4462 | 


| 4463 


! 4464 | 


| 4465 | 


| 4466 


! 4467 


I 4468 ! 


| 4469 ! 


I 4470 | 


4471 i 


i 4472 


I 4473 j 


| 4474 I 


4475 ! 


4476 I 


| 4477 ! 


4478 i 


i 4479 ! 


| 4480 


| 4481 


r- 
cn 

LO 

<£> 
o 
C 

Q 
O 

LU 

if) 


00 

cn 
m 

CD 
o 
C 

D 

O 
UJ 


|SEQ ID n° 6599 | 


o 
o 

CD 
CD 
o 
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Q 

O 
UJ 
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|SEQ ID n° 6601 | 


|SEQ ID n° 6602 


|SEQIDn°6603 \ 


|SEQ ID n° 6604 


|SEQIDn°6605 


CD 
O 
CO 
CD 
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C 

Q 
O 
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o 

CD 
CO 

0 
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O 
UJ 
CO 


ISEQ ID n° 6608 j 


|SEQ ID n° 6609 ! 


|SEQ ID n° 6610 


ISEQ ID n° 6611 | 


|SEQ ID n° 6612 ! 


ISEQ ID n° 6613 I 


|SEQ ID n° 6614 


ISEQ ID n° 6615 i 


[SEQ ID n° 6616 ! 


co 

CO 

0 

C 

O 

o 

UJ 

CO 
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TABLEAU 4 . Localisation des 139 contigs de sequence SEQ ID No. 1 a SEQ ID No. 
139 sur la sequence genomique complete (SEQ ID No. 2345). 







Position sur genome 
complet (= SEQ ID n°2345) 


Sens 


SEQ ID 


Contig 


position Debut 


position Fin 


(m=minus / 

p— piUS; 


^FO in n°1 

OLW IU II I 


OUIUiy 1 


1 jjuvWO 


1 «303yy 1 


m 


<^FO in n°9 


Pnnfin9 


OH I OJ I 


^41 190 

OH I IZU 


m 


' qpd in n°i 

i OCU IU 11 o 


uunuyo 


47fi7QR 
*t f O / y O 


47fi4i ft 


m 


cpn in n°A 
ocu iu n *» 


v^onugH 


l*t / 3/ 1 Z 


147*\HftK 
If/ DUOD 


m 


■ ^pn in 

ocu iu n d 


isunugo 


7RAR1R 
/ 0*tO I O 




m 


cpn in n°fi 
ocu iu n o 


o on ii go 


1 7CCR9fi 


17<\79m 
I / Of ZO l 


P 


<SFO in n°7 
olv iu n / 


r^nntin7 

ounug / 


1 «79U 1 UO 


1 Q4QA4ft 


m 


cpn in n°A 
ocu iu n o 


f^nntinft 
v-*uniiyo 


1 "}R99*> 


1 **Rft7fi 
I OOO # O 


P 


cpn in n°Q 


oonugy 


9HQ7RQ1 
zuy / oy i 


nnQft9ftO 


P 


OCU IU 11 IU 


ouimy iu 


19^R4Q1 
IZOO**y I 




m 


CPO in n°1 1 

ocu iu n ii 


v^onug i I 


1 OO^ 1 ou 


1 00 1 mo 


m 


qfo in n°i9 
ocu iu n \£. 


ooniig iz 


IU090HO 


I UOOjjj 


m 


ccn in n°1 ^ 
ocu iu n i o 


L/unug i j 


W?7Rft 


CCC1PQ 

dod i oy 


m 


cpn in n°i^ 

ocu iu n !*♦ 


uunug if 


9017Q9R 


OH17407 
ZU 1 / HOf 


m 


^fo in n°m 

OCU IU 11 1 \J 


OUIlUy 1 3 


n«vdno4 


I I DH f U I 


P 


cpn in n°iR 
ocu iu n id 


i^uniig id 


7*>9fid7 


/ JOU3 I 


P 


C.FO in n°17 
OCU IU II 1 / 


OUIlliy I r 


1 OjjjO 1 


1 ^cc07A 
1 0\J\J\Jf 0 


m 


ccn in n°ift 

OCU IU II 1 o 


v^uiiiiy i o 




1 ^JU 1 u 1 


P 


^FO in n°1Q 

OCU IU II I 57 


uuiiuy 1 y 


7Q9719 

r 3^. r IZ 


7Q^14ft 


P 


9FO in n°9fi 

OCU IU II ti\J 


UUiiuyzu 


4R17R7 

HO 1 /Of 


4ft999ft 


P 


cpo m n°99 

OCU IU II £.£. 


f*nntin99 


1 SQ09fi^ 

1 v9v^OO 


1 *?QHft49 


P 


9FO in n°9^ 

OLU IU II ^.o 


i^uimyzo 




^nftQift 

DUO? IO 


P 


^FH in n°94 

OCU IU 11 Z*t 


C^rsnt tnOA 
^/Ui luyzH 


1 1491QR 

1 1 1 ISO 


1 1494ftft 
I l*fZ*fOO 


P 


^FO in n°9^ 
ocu IU 11 £9 


r x nntin9'% 
L^uiiuyzQ 


1QR901Q 

1 yOZU 1 U 


i yo 1 1 01 


m 


9FO in n°9fi 

OCU IU II 


v^uniiyzu 


119342 


119919 


P 


9FO in n°9fl 

OlVJ IU II zo 


f*nnHn9A 
i^unuyzo 


1124069 


1123256 


m 


^IFH in n°9Q i 

OCU IU 11 


isUiiuyzy 


266586 


266900 


P 


SEQ ID n°30 


Contig30 


111013 


111623 


n 
P 


SEQ ID n°31 


Contig31 


1804173 


1804706 


P 


SEQ ID n°32 


Contig32 


2170341 


2169828 


m 


SEQ ID n°33 


Contig33 


1959867 


1959394 


m 


SEQ ID n°34 


Contig34 


1295529 


1294939 


m 


SEQ ID n°35 


Contig35 


178592 


178071 


m 


SEQ ID n°36 


Contig36 


1857103 


1856614 


m 


SEQ ID n°37 


Contig37 


1063484 


1063911 


P 


SEQ ID n°38 


Contig38 


198025 


197570 


m 


SEQ ID n°39 


Contig39 


1486076 


1486553 


P 


SEQ ID n°40 


Contig40 


2033914 


2034352 


P 


SEQ ID n°41 


Contig41 


737932 


738486 


P 


SEQ ID n°42 


Contig42 


729008 


728453 


m 


SEQ ID n°43 


Contig43 


1671733 


1672151 


P 
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SEQ ID n°44 


Contig44 


! 1103091 


1103644 


P 


SEQ ID n°45 


Contig45 


700139 


699583 


m 


SEQ ID n°46 


Contig46 


207521 


206897 


m 


SEQ ID n°47 


Contig47 


1064808 


1065099 


P 


SEQ ID n°48 


Contig48 


1091636 


1092281 


P 


SEQ ID n°49 


Contig49 


1701764 


1700906 


m 


SEQ ID n°50 


ContigSO 


609072 


609590 


P 


SEQ ID n°51 


ContigSI 


u 1459271 


1458780 


m 


SEQ ID n°52 


Contig52 


60603 


60154 


m 


SEQ ID n°53 


Contig53 


289646 


289284 


m 


SEQ ID n°54 


Contig54 


1536438 


1536058 


m 


SEQ ID n°55 


Contig55 


509420 


510430 


P 


SEQ ID n°56 


Contig56 


1559964 


1558709 


m I 


SEQ ID n°58 


Contig58 


2166712 


2165923 


m 


SEQ ID n°59 


Contig59 


1919605 


1920984 


P 


SEQ ID n°60 


Contig60 


962333 


960438 


m 


SEQ ID n°61 


Contig61 


1363649 


1365724 


P 


SEQ ID n°62 


Contig62 


1140306 


1137284 


m 


SEQ ID n°63 


Contig63 


1702242 


1706039 


P 


SEQ ID n°64 


Contig64 


1490271 


1493283 


P 


SEQ ID n°65 


Contig65 


783206 


785628 


P 


SEQ ID n°66 


Contig66 


852318 


849615 


m 


SEQ ID n°67 


Contig67 


1882303 


1880181 


m 


SEQ ID n°68 


Contig68 


1614050 


1618058 


P 


SEQ ID n°69 


Contig69 


1484885 


1490042 


P 


SEQ ID n°70 


Contig70 


510495 


516449 


P 


SEQ ID n°71 


Contig71 


125082 


121213 


m 


SEQ ID n°72 


Contig72 


1557644 


1551892 


m 


SEQ ID n°73 


Contig73 


145707 


143269 


m 


SEQ ID n°74 


Contig74 


859105 


852465 


m 


SEQ ID n°75 


Contig75 


1219383 


1215342 


m 


SEQ ID n°76 


Contig76 


1091627 


1086724 


m 


SEQ ID n°77 


Contig77 


1245975 


1251984 


P 


SEQ ID n°78 


Contig78 


115260 


121688 


P 


SEQ ID n°79 


Contig79 


1100300 


1092624 


m 


SEQ ID n°80 


Contig80 


1107948 


1100525 


m 


SEQ ID n°81 


Contig81 


1245466 


1237461 


m 


SEQ ID n°82 


Contig82 


2111296 


2104033 


m 


SEQ ID n°83 


Contig83 


33479 


27132 


m 


SEQ ID n°84 


Contig84 


1339614 


1350526 


P 


SEQ ID n°85 


Contig85 


2070423 


2058143 


m 


SEQ ID n°86 


Contig86 


1462530 


1470059 


P 


SEQ ID n°87 


Contig87 


526582 


517432 


m 


SEQ ID n°88 


Contig88 


1484487 


1470171 


m 


SEQ ID n°89 


Contig89 


1124087 


1136746 


P 


SEQ ID n°90 


Contig90 


1879890 


1866931 


m 


SEQ ID n°91 


Contig91 


1721684 


1706045 


m 


SEQ ID n°92 


Contig92 


1358184 


1357897 


m 


SEQ ID n°93 


Contig93 


1577596 


1560798 


m 


SEQ ID n°94 


Contig94 


115130 


103188 


m 
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SEQ ID n°95 


Contig95 


1921051 


1933881 


P 


SEQ ID n°96 


Contig96 


1944905 


1933782 


m 


SEQ ID n°97 


Contig97 


1919624 


1906953 


m 


SEQ ID n°98 


Contig98 


2090559 


2103658 


P 


SEQ ID n°99 


Contig99 


1237482 


1219423 


m I 


SEQ ID n°100 


ContiglOO 


1123110 


1108191 


m 


SEQ ID n°101 


Contig101 


1551836 


1529458 


m 


SEQ ID n°102 


Contig102 


1818811 


1800978 


m 


SEQ ID n°103 


Contig103 


764781 


783195 


P 


SEQ ID n°104 


Contig104 


1086606 


1065938 


m 


SEQ ID n°105 


Contig105 


125425 


143102 


P 


SEQIDn°106 


Contig106 


962438 


984387 


P 


SEQ ID n°107 


Contig107. 


1169838 


1190193 


P 


SEQ ID n°108 


Contig108 


2090426 


2070667 


m 


SEQ ID n°109 


Contig109 


1140315 


1169462 


P 


SEQ ID n°111 


Contig111 


238297 


258413 


P 


SEQ ID n°112 


Contig112 


216686 


237881 


P 


SEQ IDn°113 


Contig113 


2209521 


16967 


m 


SEQ ID n°114 


Contig114 


1883537 


1906918 


P 


SEQ ID n°115 


Contig115 


145772 


172009 


P 


SEQ ID n°116 


Contig116 


508181 


! 477405 


m 


SEQ ID n°117 


Contig117 


859233 


888273 


P 


SEQ ID n°118 


Contig118 


1529046 


1494213 


m 


SEQ ID n°119 


Contig119 


473132 


438871 


m 


SEQ IDn°120 


Contig120 


1981657 


1945366 


m 


SEQ ID n°121 


Contig121 


1613824 


1577594 


m 


SEQ IDn°122 


Contig122 


1765846 


1800817 


P 


SEQ ID n°123 


Contig123 


2111499 


2153851 


P 


SEQ ID n°124 


Contig124 


1721668 


1765765 


P 


SEQ ID n°125 


Contig125 


984406 


1025178 


P 


SEQ ID n°126 


Contig126 


1293488 


1339586 


P 


SEQ ID n°127 


Contig127 


216691 


176332 ! 


m 


SEQ IDn°128 


Contig128 


1818941 


1866861 


P 


SEQ IDn°129 


Contig129 


849565 


785796 


m 


SEQ IDn°130 


Contig130 


888292 


960270 


P 


SEQ ID n°131 I 


Contig131 


2208563 


2155215 


m 


SEQ ID n°132 


Contig132 


33590 


88257 


P 


SEQIDn°133 


Contig133 


1982609 


2057812 


P 


SEQ ID n°134 


Contig134 


1700642 


1618142 


m 


SEQ IDn°135 


Contig135 


1293063 


1190375 


m 


SEQIDn°136 


Contig136 


1366980 


1462324 


P 


SEQ IDn°137 


Contig137 


390853 


434186 


P 


SEQ IDn°138 


Contig138 


357393 


259739 


m 


SEQ IDn°139 


Contig139 


527049 


716899 


P 
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TABLEAU 5 . Propriete d'adherence a des cellules epitheliales humaines en culture de la 
souche NEM3 1 6 de S. agalactiae et de souches mutantes derivees. 



Souche 


Gene inactive 


% d'adhesion" 






Cellules A549 


Cellules Hela 


NEM316 


aucun 


9 


16 


NEM1979 


IPFN° 1268 (srtA) 


1,5 


2 


NEM2056 


IPFN° 678 


2 


n.t. 


NEM2057 


IPFN° 1503 


4,5 


n.t. 



5 a , le pourcentage d'adhesion correspond au nombre de bacteries (Unite Formant des 
Colonies, UFC) restant adherentes aux cellules apres lavage avec du tampon PBS par 
rapport au nombre d'UFC ajoutees a la monocouche de cellules epitheliales. 
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TABLEAU 7 . Distribution des genes codant pour des proteines de surface a motif 
LPXTG parmi des isolats cliniques independants de 5 serotypes deSl agalactiae. 



ScqlD 

(ADN) 


N° d'IPF 


Proportion des souches portant le gene 


Type la 
23 isolats 


Type lb 
7 isolats 


Type II 
12 isolats 


Type III 
39 isolats 


Type V 

16 
isolats 


non 
groupe 
2 isolats 


Frequence 

totale 
99 isolats 


4926 


1503 


i fin 
IU0 


i aa 

100 


i nn 

100 


100 


i nn 

100 


100 


1 r\f\ 

100 


6331 


67X 


i nn 
1 00 


i fin 

100 


i nn 

100 


i nn 

100 


i nn 

100 


i nn 

100 


1 nn 

100 


5491 




100 


i nn 

100 


i nn 

100 


100 


100 


100 


1 f\f\ 

100 


5234 


1X61 


100 


i nn 
100 


i nn 
100 


i nn 

100 


t nn 

100 


i nn 

100 


100 


6246 


584 


100 


i nn 
100 


i nn 
100 


i nn 

100 


i nn 

100 


i nn 

100 


i nn 
100 


5842 


2X0 


100 


i nn 
100 


i nn 

100 


100 


100 


i r\f\ 

100 


i f\f\ 

100 


6247 


5X5 


OIL C% 

86,9 


Of *7 

85,7 


n i t 

91,7 


92,3 


81,3 


i nn 

100 


oo n 

88,9 


4965 


1551 


34,8 


or n 
85,/ 


i nn 
100 


94,8 


93,8 


i nn ' 
100 


OA O 

80,8 


6447 


807 


zo,l 


85,/ 


83,3 


92,3 


m o 
93,8 


i nn 
100 


TO) O 

/9,8 


5610 


2337 


86,9 


i nn 
100 


i nn 
100 


56,4 


i nn 

100 


f A 

50 


no o 
78,8 


6236 


571 


82,6 


i nn 
100 


83,3 


/i ^ 1 
46,1 


i nn 

100 


cn 
50 


71,7 


5103 


1716 


01 0 


1 nn 




JO,J 


51,3 


^n 


O /, / 


5607 


2334 


56,5 


100 


83,3 


46,1 


100 


50 


65,6 


6411 


765 


30,4 


71,4 


41,7 


61,5 


87,5 


100 


57,6 


4921 


15 


65,2 


0 


41,7 


59 


12,5 


50 


46,5 


5090 


17 


4,3 


14,3 


16,7 


20,5 


6,3 


0 


13,1 


5180 


18 


4,3 


14,3 


0 


20,5 


6,3 


0 


11,1 


4706 


1248 


0 


0 


0 


12,8 


6,3 


0 


6 


5497 


220 


0 


14,3 


8,3 


5,1 


0 


0 


4,5 


4708 


1250 


0 


14,3 


0 


5,1 


0 


0 


3 


5677 


2414 


0 


0 


0 


7,7 


0 


0 


3 
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TABLEAU 8 . Lipoproteins 



SeqID 

(ADN) 


N° 
d'IPF 




6527 


9 


unknown 


6030 


339 


similar to unknown proteins 


6035 


344 


Similar to ABC transporter (binding protein) 


6137 


460 


Similar to ABC transporter (binding protein) 


6178 


504 


similar to unknown proteins 


6294 


638 


Similar to unknown proteins 


6335 


682 


Similar to adhesion proteins 


6377 


729 


similar to oligopeptide and pheromone binding protein 


6386 


739 


similar to other lipoprotein 


4495 


1018 


Similar to (oligopeptide) ABC transporter (binding protein) 


4596 


1119 


similar to ribose ABC transporter (binding protein) 


4636 


1162 


similar to (amino acid ?) ABC transporter (binding protein) 


4730 


1280 


similar to ABC transporter (binding protein) 


4816 


1377 


Similar to nickel ABC transporter (binding protein) 


4836 


1399 


similar to phosphate ABC transporter (binding protein) 


4906 


1481 


Similar to D,D-carboxypeptidase 


4920 


1499 


similar to peptidyl-prolyl cis-trans isomerase 


4925 


1502 


similar to metal ABC transporter (binding protein) 


4963 


1547 


Unknown 


5021 


1617 


Similar to unknown lipoprotein 


5158 


1775 


similar to ferrichrome ABC transporter (binding protein) 


5247 


1879 


similar to oligopeptide ABC transporter (binding protein) 


5306 


1955 


similar to glycine betaine/carnitine/choline ABC transporter (osmoprotectant- 
binding protein) 


5417 


2099 


similar to putative ABC transporter (binding protein) 


5423 


2103 


Unknwon, similar to unknown protein and to B. subtilis SpoIIIJ protein 


5450 


2133 


aminin-binding surface protein 


5486 


2185 


putative ABC transporter (binding protein) 
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5559 


2278 


putative ABC transporter (binding protein) 


5591 


2314 


similar to protease maturation protein 


5677 


2414 


Similar to plasmid related proteins, Putative peptidoglycan bound protein 
(LPXTG motif) 


5718 


2464 


Similar to unknown proteins 


5732 


2482 


similar to ferrichrome ABC transporter (binding protein) 


5799 


2597 


similar to amino acid ABC transporter (binding protein) 


5800 


2598 


similar to phosphate ABC transporter (binding protein) 


5837 


2789 


Unknown 


5861 


2843 


Similar to amino acid ABC transporter (binding protein) 


5883 


2875 


Unknown 


5923 


2922 


Similar to amino acid ABC transporter (binding protein) 



Les genes codant pour des lipoproteins ont et£ identifies sur !a base de la 
prediction du motif de coupure / modification de type lipoproteine [S. Hayashi, H. C. 
Wu. J Bioenerg Biomembr. 22, 451 (1990)] et d*un peptide signal (identifie en utilisant 
5 SignalP vs2.0 [H Nielsen, Prot Engin 12, 13-9. (1999)]) et par 1'analyse des resultats de 
comparaison sur les banques de sequence proteiques en utilisant BLAST [S. F. Altschul 
et al., Nucleic Acids Res 25, 3389-402. (1997)]. 



Tableau 9 . Autres proteines de surface 

10 



SeqID 

(ADN) 


N° d'IPF 


Annotation 


6037 


347 


group B streptococcal surface immunogenic protein 


4972 


1562 


Putative cell wall protein, weakly similar to peptidase or esterase 


6569 


948 


similar to fibronectin-binding protein 


5234 


1861 


similar to cell wall proteins 


5530 


2238 


possible surface protein 


5223 


1847 


CAMP factor 
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Ces proteines ont ete identifiees sur la base de similarity avec d'autres proteines 
de surface bacterienne et la prediction d'un peptide signal et ne faisant pas partie des 
classes des proteines ancrees au peptidoglycane et lipoproteines. 



5 TABLEAU 1 0 . Proteines impliquees dans la biosynthese de composes 
polysaccharidiques de la paroi de 5. agalactiae. 



SeqID 

(ADN) 


N° d'IPF 


Annotation 


Com menta ires 


4861 


1430 


similar to Streptococcus mutans RgpG protein required for 
biosynthesis of rhamnose-glucose polysaccharide 




6214 


544 


similar to rhamnosyltransferase 




6061 


381 


Unnown, Similar to UDP-N-acetylmuramoylalanine— D- 
glutamate ligase 




6517 


890 


similar to Cell Wall Muropeptide Branching Enzyme 




6518 


891 


similar to cell wall muropeptide branching enzyme 




6519 


892 


similar to cell wall muropeptide branching enzyme 




4743 


1295 


similar to glycosyltransferases 




6343 


692 


similar to hexosyl transferase 




6342 


691 


similar to glucosyl transferase 




5326 


1977 


Similar to UDP-D-glucose:gaIactosyl glucosyltransferase 




4952 


1532 


similar to N-acetylneuraminic acid synthetase 


Biosynthese de 
la capsule 


5619 


2346 


capsular polysaccharide biosynthesis protein 


5618 


2345 


similar to glycosyl transferase 


5617 


2344 


similar to glycosyl transferase 


5616 


2343 


capsular polysaccharide repeating-unit polymerase 


5615 


2342 


beta- 1 ,4-galactosyltransferase 


5614 


2341 


beta-l,4-galactosyltransferase enhancer 


5613 


2340 


similar to glucose- 1 -phosphate transferase 


5611 


2339 


capsular polysaccharide chain length regulator/exporter 


5696 


2437 


putative chain length regulator CpsC 




5971 


301 


similar to dTDP-glucose-4,6-dehydratase 




5233 


1860 


similar to to Cell Wall Muropeptide Branching Enzyme 
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5602 


2329 


similar to capsular polyglutamate biosynthesis 




5156 


1773 


Similar to UDP-N-acetylmuramoylalanyl-D-glutamyl-2, 6- 
diaminopimelate ligase 




5574 


2297 


Similar to putative hexosyltransferase 




5573 


2296 


Similar to rhamnosyl transferase 1 




5654 


2386 


Similar to capsular polysaccharide synthesis protein 




5656 


2388 


Similar to putative rhamnosyltransferase 




5526 


2233 


Similar to putative rhamnosyltransferase 




5527 


2235 


Similar to nucleotide-sugar dehydratase 




5529 


2237 


Similar to Pneumococcal LicD2 protein involved in 
phosphorylcholine metabolism 




5534 


2241 


similar to rhamnosyltransferase 




5625 


2354 


similar to putative rhamnosyltransferase 




5626 


2355 


dTDP-L-rhamnose synthase 




6223 


555 


Similar to putative glucosyl transferase 




6229 


562 


Similar to hypothetical glycosyl transferase 




6230 


563 


Similar to putative glycosyltransferase 




6231 


565 


Similar to putative glycosyl transferase 




6232 


566 


Similar to putative glycosyl transferase 




6233 


567 


Similar to putative glycosyl transferase 




5764 


2518 


similar to putative sugar transferase 




6095 


416 


similar to UDP-N-acetylglucosamine pyrophosphorylase 




5089 


1699 


Similar to UDP-N-acetylmuramate-alanine ligase 




5466 


2158 


similar to glycosyl transferase 




5465 


2157 


similar to glycosyl transferase 





Ces genes ont ete identifies par Tanalyse des resultats de similarity avec les 
sequences proteiques connues en utilisant le logiciel BLASTR Les produits de ces 
genes pourraient intervenir dans la biosynthese de polysaccharides qui pourraient etre 
5 des constituants de preparations vaccinales. 
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REVENDICATIONS 

1. Sequence nucleotidique isolee de Streptococcus agalacdae, caracterisee en 
ce qu'elle est choisie parmi les sequences SEQ ID No. 1 a SEQ ID No. 139 et SEQ ID 

5 No. 2345. 

2. Sequence nucleotidique isolee de Streptococcus agalactiae, caracterisee en 
ce qu'elle est choisie parmi : 

a) une sequence nucleotidique comportant au mo ins 75 % d'identite avec une sequence 
choisie parmi SEQ ID No. 1 a SEQ ID No. 139 et SEQ ED No. 2345 ; 
10 b) une sequence nucleotidique hybridant dans des conditions de forte stringence avec 
une sequence choisie parmi SEQ ID No. 1 k SEQ ED No. 139 et SEQ ID No. 2345, et 
comprenant au moins 20 nucleotides ; 

c) une sequence nucleotidique complementaire d'une sequence choisie parmi SEQ ED 
No. 1 a SEQ ID No. 139 et SEQ ID No. 2345, ou complementaire d'une sequence 

1 5 nucleotidique telle que definie en a), ou b), ou une sequence nucleotidique de TARN 
correspondant a Tune des sequences a) ou b) ; 

d) une sequence nucleotidique d'un fragment representatif d'une sequence choisie 
parmi SEQ ID No. 1 a SEQ ID No. 139 et SEQ ID No. 2345, ou d'un fragment 
representatif d'une sequence nucleotidique telle que definie en a), b) ou c) et 

20 comprenant au moins 20 nucleotides ; 

e) une sequence nucleotidique comprenant une sequence telle que definie en a), b), c) 
ou d) ; et 

f) une sequence nucleotidique telle que definie en a), b), c), d) ou e) modifiee et 
comportant au plus 10 % de nucleotides modifies par rapport a la sequence de 

25 reference. 

3. Sequence nucleotidique selon la revendication 2, caracterisee en ce qu'il 
s'agit d'une sequence issue d'une sequence choisie parmi SEQ ID No. 1 k SEQ ID No. 
139 et SEQ ID No. 2345, et en ce qu'elle code pour un polypeptide, choisi de 
preference parmi les sequences SEQ ID No. 140 a SEQ ID No. 2344 et SEQ ID No. 

30 2346 a SEQ ID No. 4481. 

4. Sequence nucleotidique caracterisee en ce qu'elle comprend une sequence 
nucleotidique choisie parmi : 

a) une sequence nucleotidique selon la revendication 3 ou choisie parmi les sequences 
SEQ ID No. 4482 k SEQ ID No. 6617 ; 
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b) une sequence nucleotidique comportant au moins 75 % d'identite avec une sequence 
nucleotidique selon la revendication 3 ; 

c) une sequence nucleotidique s'hybridant dans des conditions de forte stringence avec 
une sequence nucleotidique selon la revendication 3 et comprenant au moins 20 

5 nucleotides ; 

d) une sequence nucleotidique compiementaire ou d'ARN correspondant a une 
sequence telle que definie en a), b) ou c) ; 

e) une sequence nucleotidique d'un fragment representatif d'une sequence telle que 
definie en a), b), c) ou d) et comprenant au moins 20 nucleotides ; et 

10 f) une sequence telle que definie en a), b), c), d) ou e) modifiee et comportant au plus 
10 % de nucleotides modifies par rapport a la sequence de reference. 

5. Polypeptide code par une sequence nucleotidique selon Tune des 
revendications 2 a 4. 

6. Polypeptide selon la revendication 5. caracterise en ce qu'il est choisi parmi 
15 les polypeptides choisis parmi SEQ ID No. 140 a SEQ ED No. 2344, et SEQ ID No. 

2346 a SEQ ID No. 4481. 

7. Polypeptide caracterise en ce qu'il comprend un polypeptide choisi parmi : 

a) un polypeptide selon Tune des revendications 5 et 6 ; 

b) un polypeptide presentant au moins 80 % d'identite avec un polypeptide selon Tune 
20 des revendications 5 et 6 ; 

c) un fragment d'au moins 5 acides amines d'un polypeptide selon l'une des 
revendications 5 et 6, ou tel que defini en b) ; 

d) un fragment biologiquement actif d'un polypeptide selon l'une des revendications 5 
et 6 9 ou tel que defini en b) ou c) ; et 

25 e) un polypeptide selon l'une des revendications 5 et 6 ou tel que defini en b), c) ou d) 
modifie et comportant au plus 10 % d'acides amines modifies par rapport a la 
sequence de reference. 

8. Sequence nucleotidique codant pour un polypeptide selon la revendication 

7. 

30 9. Sequence nucleotidique isolee codant pour un polypeptide specifique de 

Streptococcus agalactiae choisi parmi les polypeptides de sequence SEQ ID No. 140 a 
SEQ ID No. 2344 et SEQ ID No. 2346 a SEQ ID No. 4481 . 
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10. Sequence nucleotidique selon Tune des revendications 2 a 4, 8 et 9, 
caracterisee en ce qu'elle code pour un polypeptide de Streptococcus agalactiae 
implique dans la biosynthese des acides amines ou Tun de ses fragments. 

11. Sequence nucleotidique selon Tune des revendications 2 a 4, 8 et 9, 
5 caracterisee en ce qu'elle code pour un polypeptide de Streptococcus agalactiae 

implique dans la biosynthese des cofacteurs, groupes prosthetiques et transporteurs ou 
Tun de ses fragments. 

12. Sequence nucleotidique selon Tune des revendications 2 a 4, 8 et 9, 
caracterisee en ce qu'elle code pour un polypeptide d'enveloppe cellulaire ou situe a la 

1 0 surface de Streptococcus agalactiae ou Tun de ses fragments. 

13. Sequence nucleotidique selon Tune des revendications 2 a 4, 8 et 9, 
caracterisee en ce qu'elle code pour un polypeptide de Streptococcus agalactiae 
implique dans la machinerie cellulaire ou Fun de ses fragments. 

14. Sequence nucleotidique selon l'une des revendications 2 a 4, 8 et 9, 
15 caracterisee en ce qu'elle code pour un polypeptide de Streptococcus agalactiae 

implique dans le metabolisme intermediate central ou Fun de ses fragments. 

15. Sequence nucleotidique selon Fune des revendications 2 a 4, 8 et 9, 
caracterisee en ce qu'elle code pour un polypeptide de Streptococcus agalactiae 
implique dans le metabolisme £nergenique ou Fun de ses fragments. 

20 16. Sequence nucleotidique selon l'une des revendications 2 a 4, 8 et 9, 

caracterisee en ce qu'elle code pour un polypeptide de Streptococcus agalactiae 
implique dans le metabolisme des acides gras et des phospholipides ou Fun de ses 
fragments. 

17. Sequence nucleotidique selon Fune des revendications 1 2 k 4, 8 et 9, 
25 caracterisee en ce qu'elle code pour un polypeptide de Streptococcus agalactiae 

implique dans le metabolisme des nucleotides, des purines, des pyrimidines ou 
nucleosides ou Fun de ses fragments. 

18. Sequence nucleotidique selon Fune des revendications 2 a 4, 8 et 9, 
caracterisee en ce qu'elle code pour un polypeptide de Streptococcus agalactiae 

30 implique dans les fonctions de regulation ou Fun de ses fragments. 

19. Sequence nucleotidique selon Fune des revendications 2 a 4, 8 et 9, 
caracterisee en ce qu'elle code pour un polypeptide de Streptococcus agalactiae 
implique dans le processus de replication ou Fun de ses fragments. 
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20. Sequence nucleotidique selon Tune des revendications 2 a 4, 8 et 9, 
caracterisee en ce qu'elle code pour un polypeptide de Streptococcus agalactiae 
implique dans le processus de transcription ou Tun de ses fragments. 

21. Sequence nucleotidique selon Tune des revendications 2 a 4, 8 et 9, 
5 caracterisee en ce qu'elle code pour un polypeptide de Streptococcus agalactiae 

implique dans le processus de traduction ou Tun de ses fragments. 

22. Sequence nucleotidique selon Tune des revendications 2 a 4, 8 et 9, 
caracterisee en ce qu'elle code pour un polypeptide de Streptococcus agalactiae 
implique dans le processus de transport et de liaison des prolines ou Fun de ses 

10 fragments. 

23. Sequence nucleotidique selon Tune des revendications 2 a 4, 8 et 9, 
caracterisee en ce qu'elle code pour un polypeptide de Streptococcus agalactiae 
implique dans Fadaptation aux conditions atypiques ou Tun de ses fragments. 

24. Sequence nucleotidique selon Tune des revendications 2 a 4, 8 et 9, 
15 caracterisee en ce quelle code pour un polypeptide de Streptococcus agalactiae 

implique dans la sensibilite aux medicaments et analogues ou Tun de ses fragments. 

25. Sequence nucleotidique selon Tune des revendications 2 a 4, 8 et 9, 
caracterisee en ce qu'elle code pour un polypeptide de Streptococcus agalactiae 
implique dans les fonctions relatives aux transposons ou Tun de ses fragments. 

20 26. Sequence nucleotidique isolee de Streptococcus agalactiae, caracterisee en 

ce qu'elle est choisie parmi : 

a) une sequence choisie parmi les sequences SEQ ID N° 
6194,6236,5497,5791,5103,4705,5610,5234,4926,6331,6247,5842,5741,4921,5090,518 
0,4706,4708,5677,6246,64 1 1 ,5578,6446,6447,5607,6209,62 1 5,5406,5658,4965, de 

25 preference parmi les sequences SEQ ID N°4926,633 1 ,5491 ,5234,6246,5842 ; 

b) une sequence nucleotidique comportant au moins 75 % d'identite avec une 
sequence nucleotidique du a) ; 

c) une sequence nucleotidique s'hybridant dans des conditions de forte 
stringence avec une sequence nucleotidique du a) ou b) et comprenant au moins 20 

30 nucleotides ; 

d) une sequence nucleotidique compiementaire ou d'ARN correspondant a une 
sequence telle que definie en a), b) ou c) ; 

e) une sequence nucleotidique d'un fragment representatif d'une sequence telle 
que definie en a), b), c) ou d) et comprenant au moins 20 nucleotides ; et 
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f) une sequence telle que definie en a), b), c), d) ou e) modifiee et comportant 
au plus 10 % de nucleotides modifies par rapport a la sequence de reference ; 

et en ce qu'elle code pour une proteine de surface avec un motif d'ancrage 
LPXTG. 

5 27. Sequence nucleotidique isolee de Streptococcus agalactiae, caracterisee en 

ce qu'elle est choisie parmi les sequences SEQ ID 
N°6035,6137,6335,6377,6386,4495,4596,4636,4730^ 

247, 5306,5417,5450,5486,5559,5591,5677,5732,5799,5800,5861,5923 et en ce qu'elle 
code pour une lipoproteins 
10 28. Sequence nucleotidique isolee de Streptococcus agalactiae, caracteris6e en 

ce qu'elle est choisie parmi les sequences SEQ ID 
N°4861,6214,6061,6517,6518,6519,4743,6343,6342,5326,4952,5619,5618,^ 
615,5614,5613,5611,5696,5971,523^ 

,5534,5625,5626,6223,6229,6230,6231,6232,6233,5764,6095,5089,5466,5465 et en ce 
15 qu'elle code pour une proteine impliqufe dans la biosynthese de composes 

polysaccharidiques de paroi. 

29. Polypeptide selon 1'une des revendications 5 a 7, caracterise en ce qu'il 

s'agit d'un polypeptide de Streptococcus agalactiae implique dans la biosynthese des 

acides amines ou Tun de ses fragments. 
20 30. Polypeptide selon l'une des revendications 5 a 7, caracterise en ce qu'il 

s'agit d'un polypeptide de Streptococcus agalactiae implique dans la biosynthese des 

cofacteurs, groupes prosthetiques et transporteurs ou l'un de ses fragments. 

31. Polypeptide selon l'une des revendications 5 4 7, caracterise en ce qu'il 
s'agit d'un polypeptide d'enveloppe cellulaire ou situ6 k la surface de Streptococcus 

25 agalactiae ou l'un de ses fragments. 

32. Polypeptide selon l'une des revendications 5 4 7, caracterise en ce qu'il 
s'agit d'un polypeptide de Streptococcus agalactiae implique dans la machinerie 
cellulaire ou l'un de ses fragments. 

33. Polypeptide selon l'une des revendications 5 a 7, caracterise en ce qu'il 
30 s'agit d'un polypeptide de Streptococcus agalactiae implique dans le metabolisme 

intermediate central ou l'un de ses fragments. 

34. Polypeptide selon l'une des revendications 5 a 7, caracterise en ce qu'il 
s'agit d'un polypeptide de Streptococcus agalactiae implique dans le metabolisme 
energ&ique ou l'un de ses fragments. 
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35. Polypeptide selon Tune des revendications 5 a 7, caracterise en ce qu'il 
s'agit d'un polypeptide de Streptococcus agalactiae implique dans le metabolisme des 
acidcs gras et des phospholipides ou Tun de ses fragments. 

36. Polypeptide selon Tune des revendications 5 a 7, caracterise en ce qu'il 
5 s'agit d'un polypeptide de Streptococcus agalactiae implique dans le metabolisme des 

nucleotides, des purines, des pyrimidines ou nucleosides ou Pun de ses fragments. 

37. Polypeptide selon Tune des revendications 5 a 7, caracterise en ce qu'il 
s'agit d'un polypeptide de Streptococcus agalactiae implique dans les fonctions de 
regulation ou Tun de ses fragments. 

10 38. Polypeptide selon Tune des revendications 5 a 7, caracterise en ce qu'il 

s'agit d'un polypeptide de Streptococcus agalactiae implique dans le processus de 
replication ou Pun de ses fragments. 

39. Polypeptide selon Pune des revendications 5 a 7, caracterise en ce qu'il 
s'agit d'un polypeptide de Streptococcus agalactiae implique dans le processus de 

1 5 transcription ou Pun de ses fragments. 

40. Polypeptide selon Pune des revendications 5 a 7, caracterise en ce qu'il 
s'agit d'un polypeptide de Streptococcus agalactiae implique dans le processus de 
traduction ou Pun de ses fragments. 

41. Polypeptide selon Pune des revendications 5 a 7, caracterise en ce qu'il 
20 s'agit d'un polypeptide de Streptococcus agalactiae implique dans le processus de 

transport et de liaison des proteines ou Pun de ses fragments. 

42. Polypeptide selon Pune des revendications 5 a 7, caracterise en ce qu'il 
s'agit d'un polypeptide de Streptococcus agalactiae implique dans Padaptation aux 
conditions atypiques ou Pun de ses fragments. 

25 43. Polypeptide selon Pune des revendications 5 a 7, caracterise en ce qu'il 

s'agit d'un polypeptide de Streptococcus agalactiae implique dans la sensibility aux 
medicaments et analogues ou Pun de ses fragments. 

44. Polypeptide selon Pune des revendications 5 a 7, caracterise en ce qu'il 
s'agit d'un polypeptide de Streptococcus agalactiae implique dans les fonctions 

30 relatives aux transposons ou Pun de ses fragments. 

45. Polypeptide selon Pune des revendications 5 a 7, caracterise en ce qu'il est 
code par une sequence selon la revendication 26 et est une proteine de surface avec un 
motif d'ancrage LPXTG. 
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46. Polypeptide selon Tune des revendications 5 a 7, caracterise en ce qu'il est 
code par une sequence selon la revendication 27 et est une lipoproteins 

47. Polypeptide selon Tune des revendications 5 a 7, caracterise en ce qu'il est 
cod6 par une sequence selon la revendication 28 et est une proteine impliquee dans la 

5 biosynth£se de composes polysaccharidiques de paroi. 

48. Sequence nucleotidique utilisable comme amorce ou comme sonde, 
caracterisee en ce que ladite sequence est choisie parmi les sequences nucleotidiques 
selon Tune des revendications 2 a 4, 8 a 28. 

49. Sequence nucleotidique selon la revendication 48, caracterisee en ce qu'elle 
1 0 est marquee par un compose radioactif ou par un compose non radioactif. 

50. Sequence nucleotidique selon Tune des revendications 48 et 49, caracterisee 
en ce qu'elle est immobilisee sur un support, de maniere covalente ou non-covalente. 

51. Sequence nucleotidique selon la revendication 50, caracterisee en ce qu'elle 
est immobilisee sur un support tel qu'un filtre a haute densite ou une puce a ADN. 

15 52. Sequence nucleotidique selon Tune des revendications 49 a 51 pour la 

detection et/ou 1' amplification de sequences nucleiques. 

53. Puce a ADN ou filtre, caracterisee en ce qu'elle contient au moins une 
sequence nucleotidique selon la revendication 5 1 . 

54. Puce a ADN ou filtre selon la revendication 53, caracterisee en ce qu'elle 
20 contient en outre au moins une sequence nucleotidique d'un micro-organisme autre que 

Streptococcus agalactiae, immobilisee sur le support de ladite puce. 

55. Puce a ADN ou filtre selon la revendication 54, caracterisee en ce que le 
micro-organisme autre est choisi parmi un micro-organisme associe a Streptococcus 
agalactiae, une bacterie du genre Streptococcus, et un variant de Streptococcus 

25 agalactiae. 

56. Kit ou necessaire pour la detection et/ou 1* identification de bacteries 
appartenant a l'espfece Streptococcus agalactiae ou a un micro-organisme associe, 
caracterise en ce qu'il comprend une puce k ADN ou un filtre selon la revendication 53. 

57. Kit ou necessaire pour la detection et/ou l'identification d'un micro- 
30 organisme, caracterise en ce qu'il comprend une puce a ADN ou un filtre selon Tune des 

revendications 54 et 55. 

58. Kit ou necessaire pour la detection et/ou la quantification de Pexpression 
d'au moins un gene de Streptococcus agalactiae, caracterise en ce qu'il comprend une 
puce a ADN ou un filtre selon Tune des revendications 53 a 55. 
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59. Vecteur de clonage, et/ou d'expression, caracterise en ce qu'il contient une 
sequence nucleotidique selon Tune des revendications 1 a 4, 8 a 28. 

60. Cellule hote, caracterisee en ce qu'elle est transformee par un vecteur selon 
la revendication 59. 

5 61. Cellule hote selon la revendication 60, caracterisee en ce qu'il s'agit d'une 

bacterie appartenant au genre Streptococcus. 

62. Cellule hote selon la revendication 61, caracterisee en ce qu'il s'agit d'une 
bacterie appartenant a l'espece Streptococcus agalactiae. 

63. Vegetal ou animal, excepte 1'Homme, comprenant une cellule transformee 
1 0 selon Tune des revendications 60 a 62. 

64. Proc&te de preparation d'un polypeptide, caracterise en ce que Ton cultive 
une cellule transformee par un vecteur selon la revendication 59 dans des conditions 
permettant l'expression dudit polypeptide et que Ton recupere ledit polypeptide 
recombinant. 

15 65. Polypeptide recombinant susceptible d'etre obtenu par un procede selon la 

revendication 64. 

66. Procede de preparation d'un polypeptide synthetique selon Tune des 
revendications 5 a 7, 29 a 47, caracterise en ce que Ton effectue une synthese chimique 
dudit polypeptide. 

20 67. Polypeptide hybride, caracterise en ce qu'il comprend au moins la sequence 

d'un polypeptide selon l'une des revendications 5 a 7, 29 a 47 et 65, et une sequence 
d'un polypeptide susceptible d'induire une reponse immunitaire chez l'homme ou 
l'animal. 

68. Sequence nucleotidique codant pour un polypeptide hybride selon la 
25 revendication 67. 

69. Vecteur caracterise en ce qu'il contient une sequence nucleotidique selon la 
revendication 68. 

70. Anticoips monoclonal ou polyclonal, ses fragments, ou anticorps 
chimerique, caracterise en ce qu'il est capable de reconnaitre specifiquement un 

30 polypeptide selon l'une des revendications 5 a 7, 29 a 47, 65 et 67. 

71. Anticorps selon la revendication 70, caracterise en ce qu'il s'agit d'un 
anticorps marque. 
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72 Procede pour la detection et/ou 1' identification de bacteries appartenant a 
Pespcce Streptococcus agalactiae ouaun micro-organisme associe dans un echantillon 
biologique, caracterise en ce qu'il comprend les etapes suivantes : 

a) mise en contact de P Echantillon biologique avec un anticorps selon Tune des 
5 revendications 70 et 71 ; 

b) mise en evidence du complexe antigene-anticorps eventuellement forme. 

73. Procede pour la detection de l'expression d'un gene de Streptococcus 
agalactiae caracterise en ce que Ton met en contact une souche de Streptococcus 
agalactiae, avec un anticorps selon la revendication 70 ou 71 et que Ton detecte Ie 

1 0 complcxe antigene/anticorps eventuellement forme. 

74. Kit ou necessaire pour la mise en oeuvre d'un procede selon la revendication 
72 ou 73, caracterise en ce qu'il comprend les elements suivants : 

a) un anticorps selon Tune des revendications 70 et 71 ; 

b) eventuellement, les reactifs pour la constitution du milieu propice a la reaction 
1 5 immunologique ; 

c) eventuellement, les reactifs permettant la mise en evidence des complexes antigene- 
anticorps produits par la reaction immunologique. 

75. Polypeptide selon Tune des revendications 5 a 7, 32 a 47, 65 et 67, ou 
anticorps selon Tune des revendications 64 et 65, caracterise en ce qu'il est immobilise 

20 sur un support, notamment une puce a proteine. 

76. Puce a proteine, caract6risee en ce qu'elle contient au moins un polypeptide 
scion Tune des revendications 5 a 7, 32 £ 47, 65 et 67, ou au moins un anticorps selon 
Tune des revendications 70 et 71, immobilise sur le support de ladite puce. 

77. Puce a proline selon la revendication 76, caracterisee en ce qu'elle contient 
25 en outre au moins un polypeptide de micro-organisme autre que Streptococcus 

agalactiae ou au moins un anticorps dirige contre un compose de micro-organisme autre 
que Streptococcus agalactiae, immobilise sur le support de ladite puce. 

78. Kit ou necessaire pour la detection et/ou 1'identification de bacteries 
appartenant a Fespece Streptococcus agalactiae ou a un micro-organisme associe, 

30 caracterise en ce qu'il comprend une puce a proteine selon Tune des revendications 76 
et 77. 

79. Kit ou necessaire pour la detection et/ou T identification d'un micro- 
organisme, caracteris6 en ce qu'il comprend une puce k proteine selon la revendication 
77. 



JSDOC1D: <WO_020928iaA2_l_> 



WO 02/092818 




W2/03059 



80. Procede de detection et/ou d'identification de bacteries appartenant a 
l'espece Streptococcus agalactiae ouaun micro-organisme associe dans un echantillon 
biologique, caracterise en ce qu'il met en ceuvre une sequence nucleotidique selon Tune 
des revendications 2 k 4, 8, 9, 1 1 a 13, 17 a 25, 48 a 52 et 68. 
5 81. Procede selon la revendication 80, caracterise en ce qu'il comporte les 

etapes suivantes : 

a) eventuellement, isolement de l'ADN k partir de l'6chantillon biologique a analyser, 
ou obtention d'un ADNc a partir de TARN de Pechantillon biologique ; 

b) amplification sp6cifique de l'ADN de bacteries appartenant a l'espece Streptococcus 
10 agalactiae ouaun micro-organisme associe a Faide d'au moins une amorce selon 

Pune des revendications 48 a 52 ; 

c) mise en evidence des produits d ! amplification. 

82. Procede selon la revendication 80, caracterise en ce qu'il comprend les 
etapes suivantes : 

15 a) mise en contact d'une sonde nucleotidique selon Tune des revendications 48 a 52, 
avec un echantillon biologique, l'acide nucleique contenu dans Pechantillon 
biologique ayant, le cas 6cheant, prealablement ete rendu accessible a Thybridation, 
dans des conditions permettant l'hybridation de la sonde a l'acide nucleique d'une 
bacterie appartenant a Tespece Streptococcus agalactiae ouaun micro-organisme 

20 associe ; 

b) mise en evidence de Fhybride eventuellement forme entre la sonde nucleotidique et 
l'acide nucleique de Pechantillon biologique. 

83. Procede selon la revendication 80, caracterise en ce qu'il comprend les 
etapes suivantes : 

25 a) mise en contact d'une sonde nucleotidique immobilisee sur un support selon la 
revendication 50 avec un echantillon biologique, l'acide nucleique de Pechantillon 
ayant, le cas ech^ant, ete prealablement rendu accessible a l'hybridation, dans des 
conditions permettant l'hybridation de la sonde a l'acide nucleique d'une bacterie 
appartenant a l'espece Streptococcus agalactiae ouaun micro-organisme associe ; 

30 b) mise en contact de l'hybride forme entre la sonde nucleotidique immobilisee sur un 
support et l'acide nucleique contenu dans Pechantillon biologique, le cas echeant 
apres elimination de l'acide nucleique de Pechantillon biologique n'ayant pas 
hybride avec la sonde, avec une sonde nucleotidique marquee selon la revendication 
49; 
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c) mise en evidence du nouvel hybride forme a Petape b). 

84. Procede selon la revendication 83, caracterise en ce que, prealablement a 
Petape a), PADN de PechantiUon biologique ou PADNc obtenu eventuellement par 
transcription inverse de TARN de Pechantillon, est amplifie a Paide d'au moins une 

5 amorce selon Tune des revendications 48 a 52. 

85. Kit ou necessaire pour la detection et/ou Identification de bacteries 
appartenant a Pespece Streptococcus agalactiae ou a un micro-organisme associe, 
caracterise en ce qu'il comprend les elements suivants : 

a) une sonde nucleotidique selon Tune des revendications 48 a 52; 
10 b) eventuellement, les reactifs necessaires a la mise en oeuvre d'une reaction 
d'hybridation ; 

c) eventuellement, au moins une amorce selon Tune des revendications 48 a 52 ainsi 
que les reactifs necessaires a une reaction d' amplification de PADN. 

86. Kit ou necessaire pour la detection et/ou T identification de bacteries 
15 appartenant a Pespece Streptococcus agalactiae ou a un micro-organisme associe, 

caracterise en ce qu'il comprend les elements suivants : 

a) une sonde nucleotidique, dite sonde de capture, selon la revendication 50 ; 

b) une sonde oligonucleotidique, dite sonde de revelation, selon la revendication 49; 

c) eventuellement, au moins une amorce selon Tune des revendications 48 a 52 ainsi 
20 que les reactifs necessaires a une reaction d'amplification de PADN. 

87. Kit ou necessaire pour la detection et/ou Pidentification de bacteries 
appartenant a Pespece Streptococcus agalactiae ou a un micro-organisme associe, 
caracterise en ce qu'il comprend les elements suivants : 

a) au moins une amorce selon Pune des revendications 48 a 52; 
25 b) eventuellement, les reactifs necessaires pour effectuer une reaction d'amplification 
d'ADN; 

c) eventuellement, un composant permettant de verifier la sequence du fragment 
amplifie, plus particulierement une sonde oligonucleotidique selon Pune des 
revendications 48 a 52. 

30 88. Procede selon les revendications 72, 73 et 80 a 84 ou kit ou necessaire selon 

les revendications 74, 78, 79 et 85 a 87 pour la detection et/ou Pidentification de 
bacteries appartenant a Pespece Streptococcus agalactiae, caracterise en ce que ladite 
amorce et/ou ladite sonde sont choisies parmi les sequences nucteotidiques selon Pune 
des revendications 2 k 4, 8 a 28, 48 a 52, et 68 specifiques de Pespece Streptococcus 
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agalactiae, en ce que lesdits polypeptides sont choisis parmi les polypeptides selon 
Tune des revendications 5 a 7, 32 a 47, 65 et 67 specifiques de l'espece Streptococcus 
agalactiae et en ce que lesdits anticorps sont choisis parmi les anticoips selon Tune des 
revendications 70 et 71 diriges contre les polypeptides choisis parmi les polypeptides 
5 selon Tune des revendications 5 a 7, 32 a 47, 65 et 67 specifiques de l'espece 
Streptococcus agalactiae. 

89. Souche de Streptococcus agalactiae, caracterisee en ce qu'elle contient au 
moins une mutation dans au moins une sequence nucleotidique selon Tune des 
revendications 2 a 4, 8 a 28. 
10 90. Souche de Streptococcus agalactiae selon la revendication 89, caracterisee 

en ce que la mutation mene a une inactivation du gene. 

91. Souche de Streptococcus agalactiae selon la revendication 89, caracterisee 
en ce que la mutation mene a une surexpression du gene. 

92. Utilisation d'une sequence nucleotidique selon Tune des revendications 2 a 
15 4, 8 a 28, d'un polypeptide selon Tune des revendications 5 a 7, 32 a 47, 65 et 67 d'un 

anticorps selon Tune des revendications 70 et 71, d'une cellule selon Tune des 
revendications 60 a 62, et/ou d'un animal transform^ selon la revendication 63 pour la 
selection de compose organique ou inorganique capable de moduler, de reguler, 
d'induire ou d'inhiber l'expression de genes, et/ou de modifier la replication cellulaire 
20 de cellules eucaryotes ou procaryotes ou capables d'induire, d'inhiber ou d'aggraver 
chez un organisme animal ou humain les pathologies liees a une infection par 
Streptococcus agalactiae ou par un micro-organisme associe. 

93. Methode de selection de compose capable de se Her a un polypeptide selon 
l'une des revendications 5 a 7, 32 a 47, 65 et 67, capable de se lier a une sequence 

25 nucleotidique selon Tune des revendications 2 a 4, 8 a 28, ou capable de reconnaitre un 
anticorps selon Tune des revendications 70 et 71, et/ou capable de moduler, de reguler, 
d'induire ou d'inhiber l'expression de genes, et/ou de modifier la replication cellulaire 
de cellules eucaryotes ou procaryotes, ou capable d'induire, d'inhiber ou d'aggraver 
chez un organisme animal ou humain les pathologies liees a une infection par 
30 Streptococcus agalactiae, caracterisee en ce qu'elle comprend les etapes suivantes : 

a) mise en contact dudit compose avec ledit polypeptide, ladite sequence nucleotidique, 
avec une cellule transformee selon Tune des revendications 60 a 62, et/ou 
administration dudit compose a un animal transforms selon la revendication 63 ; 
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b) determination de la capacite dudit compose a se lier avec ledit polypeptide ou ladite 
sequence nucleotidique, ou de moduler, de reguler, d'induire ou d'inhiber 
l'expression de genes, ou de moduler la croissance ou la replication cellulaire, ou 
d'induire, d'inhiber ou d'aggraver chez ledit organisme animal ou humain les 

5 pathologies liees a une infection par Streptococcus agalactiae ou par un micro- 
organisme assocte. 

94. Composition pharmaceutique comprenant un compose choisi parmi les 
composes suivants : 

a) une sequence nucleotidique selon Tune des revendications 2 k 4, 8 a 28 ; 
10 b) un polypeptide selon Tune des revendications 5 a 7, 32 a 47, 65 et 67; 

c) un vecteur selon la revendication 59 ou 69 ; et 

d) un anticorps selon la revendication 70 ou 71 . 

95. Composition selon la revendication 94, eventuellement en association avec 
un vehicule pharmaceutiquement acceptable. 

15 96. Composition pharmaceutique selon Tune des revendications 94 et 95 pour la 

prevention et le traitement d'une infection par une bacterie appartenant a Tespece 
Streptococcus agalactiae. 

97. Composition immunogene, caracterisee en ce qu'elle comprend un ou 
plusieurs polypeptides selon Tune des revendications 5 a 7, 32 a 47, 65, et/ou un ou 

20 plusieurs polypeptides hybrides selon la revendication 67. 

98. Utilisation d'une cellule selon l'une des revendications 60 a 62, ou d'un 
vecteur selon Tune des revendications 59 ou 69 pour la preparation d'une composition 
vaccinale. 

99. Composition vaccinale, caracterisee en ce qu'elle contient un 
25 polynucleotide selon 1'une des revendications 1 a 4, 8 a 28, un vecteur selon Tune des 

revendications 59 ou 69, et/ou une cellule selon Tune des revendications 60 & 62. 

100. Composition vaccinale, caracterisee en ce qu'elle contient au moins un 
polypeptide cod£par un polynucleotide de sequence choisie parmi SEQ ID 
N° 1 503,678,2 1 92, 1 86 1 ,5 84,280. 

30 101. Composition vaccinale selon la revendication 100, caracterisee en ce qu'il 

s'agit d'une composition veterinaire 

102. Composition immunogene capable d'induire une r6ponse immunitaire 
cellulaire ou humorale pour la prevention ou le traifement d ! une infection par une 
bacterie appartenant k Tespece Streptococcus agalactiae, caracterisee en ce qu'elle 
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comprend une composition immunogene selon la revendication 97, ou une composition 
vaccinale selon la revendication 99 ou 100, en association avec un vehicule 
pharmaceutiquement acceptable et eventuellement un ou plusieurs adjuvants de 
l'immunite appropries. 

5 103. Banque genomique de Streptococcus agalactiae CIP 82.45 (ATCC 

12403). 

104. Banque d'ADN genomique selon la revendication 101, caracterisee en ce 
que ladite banque d'ADN est clonee dans un plasmide. 

105. Banque selon la revendication 101 ou 102, caracterisee en ce qu'il s'agit 
10 de la banque deposee a la CNCM le 28 decembre 2000 sous le N° 1-261 0. 

106. Utilisation des banques g&iomiques selon Tune des revendications 101 a 
103 pour isoler des sequences nucleotidiques specifiques de Streptococcus agalactiae, 
caracterisee en ce que les sequences nucleotidiques de Streptococcus autres que 
Streptococcus agalactiae CIP 82.45 (ATCC 12403) sont alignees et en ce que les 

15 donnees obtenues par cet alignement sont traitdes pour isoler lesdites sequences 
specifiques. 

107. Proced6 d'identification de sequence specifique de Streptococcus 
agalactiae, caract6rise par 1'alignement de sequences nucleotidiques de Streptococcus 
agalactiae selon les revendications 1 a 4, 8 a 9 et le traitement des donnees obtenues par 

20 cet alignement pour isoler les sequences specifiques. 

108. Souche mutante NEM 1979 de Streptococcus agalactiae selon la 
revendication 89 d6posee a la CNCM le 24 avril 2002 sous le N° 1-2861. 

109. Souche mutante NEM 2056 de Streptococcus agalactiae selon la 
revendication 89 deposee a la CNCM le 24 avril 2002 sous le N° 1-2862. 

25 110. Souche mutante NEM 2057 de Streptococcus agalactiae selon la 

revendication 89 deposee a la CNCM le 24 avril 2002 sous le N° 1-2863. 
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cited to establish the publication date of another citation or other 
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"O" document referring to an oral disclosure, use, exhibition or other 
means 

T" document published prior to the international filing date but later than 
the priority date claimed 



T" later document published after the international filing date or priority 
date and not in conflict with the application but cited to understand 
the principle or theory underlying the invention 

"X" document of particular relevance; the claimed invention cannot be 
considered novel or cannot be considered to involve an inventive 
step when the document is taken alone 

**Y" document of particular relevance; the claimed invention cannot be 
considered to involve an inventive step when the document is 
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Relevant to claim No. 



WO 01 14421 A (MEDIMMUNE, INC.) 
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page 11, line 13 -page 26, line 20 
Sequence listing SEQ ID NO: 5, 6 

DATABASE SMALL [in line] 

1 March 2001 (01.03.01) 

DE B0EVER, E.H. ET AL. : "TraG-rel ated 

protein" 

Database accession no. Q9F1G0 
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This international ^earchreporthas not been established inrespect of certain claims under Article 1 7(2)(a) for the following reasons : 
1. j I Claims Nos.: 

1 — because they relate to subject matter not required to be searched by this Authority, namely: 



2. | j Claims Nos.: 

because they relate to parts of the international application that do not comply with the prescribed requirements to such 
an extent that no meaningful international search can be carried out, specifically: 



3. [ ] ClaimsNos.: 

— because they are dependent claims and are not drafted in accordance with the second and third sentences of Rule 6. 4(a). 
Box II Observations where unity of invention is lacking (Continuation of item 2 of first sheet) 



This International Searching Authority found multiple inventions in this international apphcation, as follows: 
see supplementary sheet 



1. j 1 As ail required additional search fees were timely paid by the applicant, this international search report covers all 

searchable claims. 

2. Q As aU searchable claims c»id^ 

of any additional fee. 

3 . f~| As only some of the required additional search fees were timely paid by the applicant, this international search report 
— covers only those claims for which fees were paid, specifically claims Nos.: 



No required additional search fees were timely paid by the applicant Consequently, this international search report is 
restricted to the invention first mentioned in the claims; it is covered by claims Nos.: 

In particular 1-102, 107-110 



Remark on Protest Q The additional search fees were accompanied by the applicant's protest. 

Q No protest accompanied the payment of additional search fees. 
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onal application No. 

/IB 02/93059 



The Inlcrnaiional Searching Authority has determined that the present international 
application contains multiple (groups of) inventions, namely: 

1. Claims : (in part) 1-102, 107-1 10 

Nucleotide sequence of Streptococcus agalactiae, SEQ ID No. 1, 
fragments and homologues; polypeptides coded by said sequences, 
derived polypeptides, hybrids and antibodies; probe and primer derived 
from the nucleotide sequence; use thereof for selecting compounds having 
an effect on disease states caused by an S. agalactiae infection; 
pharmaceutical compositions; DNA chips and protein; kit containing said 
chips; cloning vector, host cell, plant or animal containing said nucleotide 
sequence; use of the antibodies and of the nucleotide sequences to identify 
Streptococcus agalactiae; strain of S. agalactiae containing a mutation in 
the sequence SEQ ID No. 1; use of the nucleotide sequences to identify S. 
agalacliae-specific sequences. 

2. Claims: (in part) 1-102, 107-110 

Same as invention n° 1 , for the nucleotide sequences SEQ ID Nos. 2-1 39, 
2345 and 4482-661 7 respectively. 

3. Claims: 103-106 

Gene library of Streptococcus agalactiae and use thereof. 
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INFECTION AND IMMUNITY, AMERICAN SOCIETY 

FOR MICROBIOLOGY. WASHINGTON, US, 
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pages 871-878, XP0OO973065 

ISSN: 0019-9567 
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48-99, 

102, 
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T document ulterieur publie apres la date de depdt international ou la 
date de priorite et n'appartenenant pas a retat de ia 
technique pertinent, mais cite" pour comprendre le principe 
ou la theone constituant la base de (Invention 

"X" document particulierement pertinent; I'inven tion revendiquee ne peut 
etre consideree comme nouvelle ou comme impliquant une activity 
inventive par rapport au document considere isolement 

"Y" document particulierement pertinent; finven tion revendiquee 
ne peut etre consideree comme impliquant une acMe inventive 
lorsque ie document est associe a un ou plusieurs autres 
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pour une person ne du metier 

"&" document qui fait partie de la metne famille de brevets 



Date a laquelle la recherche Internationale a et£ effectivement achevee 

18 novembre 2002 



Date d'expedition du present rapport de recherche intemationate 



19. 02. 2003 



Nom et adresse postaie de 1'administraiion chargee de la recherche Internationale 

Office Europeen des Brevets, P.B. 5818 Patentlaan 2 
NL-2280HVRi]swijk 
Tel. (+31-70) 340-2040, Tx. 31 651 epo nl, 
Fax: (+31-70) 340-301 6 



Fonctionnaire autorise 
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C(suite) DOCUMENTS CONSIDERES COMME PERTINENTS 



Categorie ° Identification des documents cites, avec, le cas echeant, rindication des passages pertinents 



no. des revendications visees 



WO 01 14421 A (MEDIMMUNE, INC.) 
1 mars 2001 (2001-03-01) 



page 11, ligne 13 -page 26, ligne 20 
Sequence listing SEQ ID NO: 5, 6 

DATABASE SWALL [en ligne] 

1 mars 2001 (2001-03-01) 

DE BOEVER, E.H. ET AL. : "TraG- related 

protein" 

Database accession no. Q9F1G0 

XP002221155 

le document en entier 

& ERIKA H. DE BOEVER ET AL. : 

"Enterococcus faecal is conjugative plasmid 

pAM373: complete nucleotide sequence and 

genetic analysis of sex phromone response" 

MOLECULAR MICROBIOLOGY, 

vol. 37, no. 6, 2000, pages 1327-1341, 

DORAN, T. I. ET AL.: "Factors Influencing 
Release of Type III Antigens by Group B 
Streptococci " 
INFECT. IMMUN., 

vol. 31, no. 2, fevrier 1981 (1981-02), 
pages 615-623, XP002191322 
page 621, colonne de gauche, alinea 2 - 
alinea 3 
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Cadre I Observations - lorsqufl a ete estime que certaines revendications ne pouvaient pas faire I'objet d'une recherche 
(suite du point 1 de la premiere feuille) 



Conformement a rarticte 17.2)a), certaines revendications n'ont pas fait robjet d'une recherche pour les motifs suivarrts: 

1. Les revendications n 08 

— se rapportent a un objet a regard duquel radministrattan n'est pas tenue de procedera la recherche, a savoin 



2. Les revendications n 08 

— se rapportent a des parties de la demands intemationaie qui ne remplissent pas suffisam merit les conditions prescrites pour 
qu'une recherche significative puisse etre effectuee, en particulier. 



3. Les revendications n M 

— sont des revendications dependantes et ne sont pas redigees conformement aux dispositions de la deuxieme et de la 
troisieme phrases de la regie 6.4.a). 

Cadre H Observations - lorsqu'il y a absence d'unite de I'invention (suite du point 2 de la premiere feuille) 

L'administration chargee de la recherche intemationale a trouve plusieurs inventions dans la demands intemationaie, a savoin 

voir feuille supplemental re 



t . I I Comme toutes les taxes additionnelles ont ete payees dans les delais par le deposant, le present rapport de recherche 
1 — ' intemationale porte sur toutes les revendications pouvant faire robjet d'une recherche. 

2. EZI Comme toutes les recherches portant sur les revendications qui s*y pretalerrt ont pu Stre effectuees sans effort particulfer 
justiflant une taxe additionnelle, l'administration n'a sollicite le palement d'aucune taxe de cette nature. 



3. I I Comme une partie seulement des taxes additionnelles demandees a et6 payee dans les delais par le deposant, le present 
I — ' rapport de recherche Internationale ne porte que sur les revendications pour lesquelles les taxes ont ete payees, a savoir 
les revendications n 08 



4. [ZT\ Aucune taxe additionnelle demandee n'a ete payee dans les delais par le deposant En consequence, le present rapport 
L^-J de recherche intemationale ne porte que sur I'invention mentionn6e en premier lieu dans les revendications; elle est 
couverte par les revendications n 08 

Parti el lement 1-102, 107-110 



Remarque quant a la reserve 



[ [ Les taxes additionnelles eteient accompagnees d'une reserve de la part du 
| | Le paiement des taxes additionnelles n'etait assorti d'aucune reserve. 
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SUITE DES RENSEIGNEMENTS INDIQUES SUR PCT/ISA/ 210 



L 1 administration chargee de la recherche Internationale a trouve 
plusieurs (groupes d") inventions dans la demande international e, a 
savoir: 

1. revendi cations: Parti el lement 1-102, 107-110 

Sequence nucleotidique de Streptococcus agalactiae SEQ ID 
N0:1, fragments et homologues; polypeptides codes par ces 
sequences, polypeptides derives, hybrides et an ti corps; 
sonde et amorce derives de la sequence nucleotidique; 
utilisation de ceux-ci pour la selection de composes ayant 
une influence sur les pathologies liees a une i nf ecti on par 
S. agalactiae; compositions pharmaceutiques; puces a ADN et 
proteine; kit ou necessaire contenant lesdites puces; 
vecteur de clbnage, cellule hote, vegetal ou animal 
contenant la sequence nucleotidique; utilisation des 
anti corps et des sequences nucleotidiques pour 
1 'identification de Streptococcus agalactiae; souche de S. 
agalactiae contenant une mutation dans la sequence SEQ ID 
N0:1; utilisation des sequences nucleotidiques pour 
identifier des sequences specifiques de S. agalactiae. 



2. revendi cations: Parti ell ement 1-102, 107-110 

Idem au sujet 1 pour, respectivement les sequences 
nucleotidiques SEQ ID N0s:2-139, 2345, and 4482-6617 



3. revendi cations: 103-106 

Banque genomique de Straptococcus agalactiae et son 
utilisation 
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